
スクレイピングを得意とする企業に入社した新入社員佐々木。
配属後はや半年を過ぎたが、まだその効果について疑問をもっている模様。
そこで佐々木がとった行動は・・・
目次
こんにちは、佐々木です。再び登場です。
みなさん、こんにちはインディゴデータの佐々木です。
以前の記事では、わたくし佐々木が体当たりで機械と対決をしたわけですが、その記事が42.62%という驚異の低離脱率を記録しまして(サイト平均は秘密)、皆様の民意にお応えすべく、第二弾ということでさらなるチャレンジをすることと相成りました。

インディゴデータ(IDD)についてのおさらい
第二弾ではあるのですが、あらためて入社して半年たった私が
簡単にインディゴデータをご説明。
- SMSデータテックの戦略的子会社
- オープンデータを独自のスクレイピング技術&分析で顧客に提供
- 最近ではSAAS型のサービスも展開して、よりスケーラブルに事業をしている(New!)

3点でまとめるようになったことです。)
人は機械にどれだけあらがえるのか?第二弾にあたり
さて、前回は焼肉店のリスト収集という、
よく考えれば絶対にスクレイピングが勝つでしょというテーマを選んだ結果、惜敗を喫してしましたわけですが、
今回はやや趣向を変えてみようと思います。
今回は私の土台である弓道で培った一瞬の機微を見逃さない集中力を発揮し、なおかつ得意な土俵で戦おう、そういうわけです。
3点でブレイクダウンして申し上げると
- 機微を見逃さない
- 焼肉が好き(食べたい)
- 寿司も好き(食べたい)
この3つのポイントをそろえた勝負に挑みます。
特定サイト監視対決!!
ということで、第二回のテーマは
「新メニューを見逃すな!サイト監視対決」!!!!!
今回は、何千というリスト収集というものではなく
厳選した私の好きな飲食店(焼肉/寿司)で、
不定期に更新される新メニューをチェックするという、スクレイピングではやりづらそうなテーマです。勝てます。
私が厳選した各ジャンル10店舗一覧がこちら!
焼肉 | 寿司 |
---|---|
牛角 | スシロー |
すたみな太郎 | くら寿司 |
安安 | すしざんまい |
焼肉 高句麗 | かっぱ寿司 |
牛繁 | すし銚子丸 |
完璧なラインナップです。飲食店の新メニュー更新のタイミングって不定期で、即座に気づくのは難しいですよね。
焼肉/寿司好きの私としては、誰よりも早く知りたい。
そして、食べたい。
この強い思いは、機械には再現できないのです。

具体的なルールとしては簡単で、
毎日Webサイトをチェックして、具体的にどのメニューが更新されたかをリスト化する。以上。
さあ、よーいスタート。本日(10/18)から戦闘の火ぶたは切って落とされたのです。

実際にやってみた
- リストのURLをたたく
- Topページとメニューページをのぞく
- メニューをエクセルに貼りだす
前回のリスト作成と違って、なんかもっと地味だな。
・
・
あー、すたみな太郎好きなんだよね。
この中落カルビは無限に食べれるんだよね。

メニュー一覧をコピペで・・
スチャッ

(ctrl + C)
ターン!
・・・
・・・
スチャッ

(ctrl + C)
ターン!
・・・
・・・
30分経過
・・・
・・・
まあ、リスト作りと比べて10店舗のメニューをコピペするのは楽勝です。
さあメニュー更新を見つけ出すのは明日からです。
佐々木の工程(二日目以降)
- リストのURLをたたく
- Topページとメニューページをのぞく
- メニューをエクセルに貼りだす
- 前日との差分を気合いで見つける
1~3:割愛
さて、本日もだるいコピペ作業もおわりました、と。
ここからです。
更新されたメニューがあるかどうか。

・・・
・・・
・・・
ん?
んん?
無い。
新メニュー更新がない。
・・・
・・・
・・・
気を取り直して、ほかの店・
・・・
・・・
無い。
いや、無い、よね。
微妙に変わったところも、ない、よね?
・・・
・・・
いやー、シンプルに新メニューが出てくれればいいのですが
更新が本当に無かった確証を得るのは、まさに悪魔の証明ともいうべき哲学的難問であることに気づき始めましたよ。私は。
これは、苦行です。
・・・
・・・
あった!!
ついにあった!!!
スシロー!!ついに更新しおったな!!!
私、佐々木の目はごまかされないぞ。


・・・
・・・
2日目は結局目を皿にして見てみたけど、スシローのみ(のはず)
これはリスト作成より、丹力を鍛えられます。
~3日目~
・・・
・・・
そこには黙々と、メニューを眺める佐々木の姿があるのであった。

ねーな。今日はゼロだ。1時間以上かけて更新ゼロだ。。
状況はこちら。
店舗名 | 10/19 | 10/20 |
牛角 | 獲れ高無し | 獲れ高無し |
すたみな太郎 | 獲れ高無し | 獲れ高無し |
安安 | 獲れ高無し | 獲れ高無し |
焼肉 高句麗 | 獲れ高無し | 獲れ高無し |
牛繁 | 獲れ高無し | 獲れ高無し |
スシロー | 新メニュー追加! | 獲れ高無し |
くら寿司 | 獲れ高無し | 獲れ高無し |
すしざんまい | 獲れ高無し | 獲れ高無し |
かっぱ寿司 | 獲れ高無し | 獲れ高無し |
すし銚子丸 | 獲れ高無し | 獲れ高無し |
未だ沈黙を貫く焼肉店。
ファーストペンギン(最初に飛び込むペンギン)であるスシロー。それに続くはだれなのか。
~4日目~21日目~
・・・・
・・・・

・・・
・・・
一方 TOWA(Webサイト監視ツール)は
0.対象となるWebサイトを指定して、取得項目を設定

マウス操作で直感的に設定をできるのが、TOWAの使いやすさの一つなんですって。
1.モニタリング開始

2.翌日からアラートが自動で!

3. なんと変更部分が一目瞭然

おお、スシローまさかの注意書きだけの更新!!

結論:TOWAの更新チェック最強やで!
TOWA: 更新把握リスト

なんと、値上げや表記変更みたいな細かな変更あったとは・・
そして、沈黙の焼肉屋。
佐々木: 痛恨の新メニュー見逃し
痛恨の新メニュー見逃し。集中力の限界か。
さらに注意書き変更は気づかないですよ・・
1日1時間のチェックが無為に消費されました。

サイト更新把握は、人のやる所業じゃない。
機械で安心、正確にっっ!!!!!!
対戦を振り返って
サイト更新チェックは、さすがに人のやる仕事ではないですね。
集中力があってもこれは無理です。
今回は、スピード勝負ではないのでいけるかな、と思ったのですが
毎日定期的に同じページを見て差分に気づくというのは、もっと過酷な勝負でしたよ。
1,2サイトの更新チェックはまあなんとかなりますが、10個を超えると厳しくなってこれが100~1,000になるともはや人智を超えます。
中盤に開いた悟りも閉じました。
ということで、ちゃんと仕事に戻って総括すると
- TOWAでは、URLを設定してNon-Codeでサイト更新チェック設定が可能
- 毎日更新を自動監視してくれて、差分をアラート
- しかも差分が簡単にわかる便利な管理画面
- な、なんと現在10社限定でβ版無料トライアル実施中!!!
ということで、スクレイピングだけでなく、サイト更新監視もIDDならお手の物ですね。
前回のリスト作りに比べて、より不利な対決を挑んでしまったわけですが
佐々木の挑戦はさらに続いていく
わたし、佐々木としてはライバルとして不足なしというのを実感できてむしろうれしくもあるわけです。
むかしのアニメのキャラも強敵に会うたびに「オラわくわくすっぞ」って言ってましたし。
逆境にこそ燃える漢(おとこ) 佐々木は、これからも挑戦し続けるのです。