DMMスクレイピング × WordPress
ちょこちょこブログ中でも話題にさせて頂いております、『Linuxお勉強使用会』 お試しの第0回からカウントすると、かれこれ4回目を開催させていただきました。
場所は前回同様、埼玉県朝霞市の朝霞中央公民館で行いました。
ちなみに会議室がどこも埋まっていたので、おもむきのある和室で皆さん座布団に正座して行い、何とも不思議な勉強会でしたw
うっかり今回は写真を撮影するのを忘れてしまいまして、ま、だいたいこんな感じだったかな?(ダイブ嘘つきましたね。)
DMMスクレイピング × WordPress
ITかあさんのお題はDMMをスクレイピングして自分のWordpressに記事として登録してしまおうというものでした。実際にスクレイピングが実行できると『おお~!』という感嘆の声を頂き、かあさん、恐縮です。
資料
しょぼくて申し訳ないのですが、資料も作りました。実際に説明することがたくさんあって、肝心のスクレイピングのやり方までは書いていないのですが(ダメじゃん)、スクレイピングの事前準備と前段階の知識として必要なことをまとめてあります。
そもそもスクレイピングとは
スクレイピングとは、WEBページに表示されている情報を、『自分の欲しいところだけ』抜き出す技術のことで、抜き出した情報を利用して自分のデータベースに登録して、あたかも自分のサイトのオリジナルデータのようにする 他人のふんどし使うちょっとずるいけど、素敵な技術のことです。
なお、少し前にもスクレイピングの技術についてはざっくりここで触れていますのでよかったら確認して下さい。今回の勉強会の発表内容はその発展、応用版です。
なぜDMMをスクレイピングしたのか
DMMをスクレイピングする方はけっこういらっしゃいまして、理由はDMMがアフィリエイトを広く展開しているのに対してAPIを配布していないので、だったらDMMをスクレイピングしてしまおうというわけです。
それではさっそくスクレイピングのはじまりはじまり~~