Python

Pythonでスクレイピングしたいならこの2冊がオススメ(初心者入門編)

「pythonの基礎勉強終わったし、なんかwebページいじくる方法知りたいな」っていう人にオススメなpythonを使ったWebスクレイピングの入門書を2冊ご紹介します。

スクレイピングとは?

インターネットのページから情報を取り出すことを指します。

この2冊を自分のものにできれば、スクレイピングの基礎はガッチガチになること間違いなしです。

では、早速紹介していきます。

Pythonスクレイピングのオススメ入門書1

created by Rinker
翔泳社
¥2,420
(2021/10/26 11:02:36時点 Amazon調べ-詳細)

この本はスクレイピングのことが全くわからない人にオススメな本です。 そもそもスクレイピングとは何かから説明してくれて、終盤は実際のWebページを使った実践まであります。

この本の一番のオススメポイントは何と言ってもわかりやすさ!

オススメポイント

スクレイピング!というワードは初心者を寄せ付けない難しそうなイメージがありますが、この本はそれを上手くかみ砕いて説明してくれています。

そもそもこの表紙見てくださいよ。こんなにかわいい羊さんとかリスさんがでてくんのに、中身激ムズやったら、こんなもんもう、ある意味詐欺ですよ。魔法少女マドカまぎかみたいなもんになっちゃいますよ。

でも、そんなことは全然ないので安心してください。わかりやすく解説されています。のんのんびより的なポジションです。

アマゾンの評価もと激高で安心

スクレイピングをとりあえずゼロから学びたい場合はこの1冊で間違いありません。

また、終盤には実際のWEBページを使用してスクレイピング解説をしてくれているので、入門書にありがちな、薄いテクニックだけ学べて、実践がほとんどないみたいなこともないのもオススメなポイントです。

次に強引にひねりだしたオススメしないポイントを紹介します。

オススメしないポイント1

「Python2年生~」というタイトルからもわかるように、この本はPython初心者のための本(1年生)ではなく、スクレイピング初心者用の本という点に注意してください。

ちなみにPython1年生は↓

なので、Python初心者はまず、1年生編、もしくは私が紹介した他のPython入門書などを読んでからでないと、内容は少し難しく感じてしまうかもしれません。

その点は注意が必要です。

オススメしないポイント2

この本はスクレイピング知識0の人にオススメと紹介しましたが、逆に言えば少し知識がある人にとっては少々物足りない内容になっています。

独学である程度スクレイピングの勉強を進めている人や、ネットに転がってるスクレイピングの情報を見て理解できる場合はこの本を読む必要はないです。

オススメする人、しない人

オススメする人

 ガチのスクレイピング初心者

オススメしない人

  • ガチのPython初心者
  • スクレイピングの知識がある程度ある人

Pythonスクレイピングのオススメ入門書2

ある程度スクレイピングの知識があって、その知識を肉付けさせて発展させたい人にオススメの本がこちら

created by Rinker
オライリー・ジャパン
¥3,520
(2021/10/26 11:02:37時点 Amazon調べ-詳細)

スクレイピング脱初心者に送りたいのが本書です。

より実践的な内容が網羅されているので、本書を習得できれば知識の補強ができることは間違いなしです。

実践的な内容例

  • APIの使用方法
  • データのクリーニング
  • フォームとログイン
  • JavaScriptのスクレイピング
  • データの格納方法

↑の内容を見ていまいちピンとこない場合は本書を読むのはまだ早いです。

本書をものにすることができれば、あとはネットに転がってる情報を集めて独学で進めていくという勉強法でスルスル成長することができるでしょう。

また、付録として、インターネットの仕組み解説であったり、WEBスクレイピングの倫理感、違法性についても解説されているので、実践的な知識だけではなく”インターネット”というものの理解を深めることができます。

オススメしないポイント1

先ほど紹介した本は動物とか出てくるし、全ページカラフルで見やすい内容になっていますが、本書はその対極に位置します。

全ページ白黒で、言い回しも難しいです。

なので、オライリーの本を読んだことがない人は面食らうかもしれません。

逆にオライリーの本を読んだことがあって、しかも読むことに抵抗が無い人は問題ないです。

オススメしないポイント2

実践的な内容が網羅されていますが、絶対に個人が使わないだろみたいな内容もあります。

例えば、自然言語の読み書きが紹介されていますが、正直イミフです。「マルコフモデル」ってなんやねんって感じです。

なので、ある程度目的をもって本書を読み、関係が無いと思った章については、読み飛ばすのも一つの手です。

オススメしないポイント3

全編を通じてPythonの知識をある程度求められます。

もちろん、いちいちPython知識についての解説はないです。なので、Pythonのコードをある程度読む力も要求されます。

スクレイピングスキルは今後ますます需要が出てくる

これからの時代、インターネット上の情報収集とそれを整理するスキルはますます需要が出てくるはずです。

なので、スクレイピングに少しでも興味があれば、今回紹介した2冊で勉強を始めるのがオススメです。

あと、スクレイピングって難しい感じしますけど、Pythonの環境構築が完了しているのであれば、結構すぐに作れることだってできちゃいます。

私は、ショッピングサイトの在庫確認とかで使用しています。(あればメール送信とか)

個人的にスクレイピングはやってて楽しいので、ぜひあなたも体験してください。