GoogleAppsScriptでWebスクレイピング

ウェブスクレイピング(Wikipediaより)

ウェブスクレイピング(Web scraping)とは、
ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。
ウェブ・クローラー(Web crawler) あるいは
ウェブ・スパイダー(Web spider)とも呼ばれる。
通常このようなソフトウェアプログラムは
低レベルのHTTP(Hypertext Transfer Protocol)を実装することで、
もしくはInternet ExplorerまたはMozilla Firefoxなどの
Webブラウザを埋め込むことによって、
人間によるWWWのブラウジングをシミュレートする。

ということで、やってみます。

まずは、先人の情報を元にコーディング

Google Apps Scriptでスクレイピングする方法(Qiita kazuhine様の投稿)

上記の実行結果はこちら

あら、できてしまいました。
以上です。お疲れ様でした。

ではちょっと物足りないので、トップページの各記事のタイトルを取得してみます。

実行結果はこちら

UrlFetchApp()でソースを引っ張ってきた後は、
正規表現で不要な箇所をゴリゴリ削っていくイメージですねぇ。