
突然ですが、はじめまして!私、スクレイピングマニアのスク・レイコと申します。
趣味はライブに行くことで、月に一度は仕事のご褒美として全国どの会場でも飛んで行っちゃいます。色んなジャンルの音楽を聞きますが、某人気アーティストYZが大好きなんです!
今度開催されるアリーナツアーにどうしても行きたい!!!
ところが、ドームツアーをやるほどの人気なので、アリーナ規模のツアーだとチケットがなかなか取れません…。
普段は家から近い会場に応募するのですが、結構外れてしまいます。
そもそも沢山の会場の中で、当たりやすい会場とそうでない会場はあるのでしょうか?
私のように、家から近い会場に応募している人は多いのではないかと感じます。
各地域ごとのファン数を知ることができれば、当たりやすい会場が分かるかも!!
そこで今回は、ツイッターのデータをもとに、ライブのチケットを求めている人が各地域にどれだけいるのかを調査してみました!
こちらの記事には、Twitterデータの取得に関する内容が含まれていますが、Twitterデータを商用利用する際には、NTTデータのサービス(※)を利用する必要があります。
※NTTデータのサービス:「Twitterデータ提供サービス(インテグレーション)」
ファンが住んでいる地域をSNSで調査!
全国のYZファンがどこにどのくらい住んでいるのかを知りたいんですが、そういった情報ってどこで知れるのでしょうか。ファンの多くが利用していて私も確認できるものといえば、ファンクラブサイトとかSNSとか…?
あ、そういえばYZはツイッターで公式アカウントを運営していますね。
好きなアーティストの公式ツイッターなら皆さんフォローするはず!
ということは「公式ツイッターのフォロワー」からファンの情報をゲットできそうです。
公式ツイッターを覗いてみましょう!

公式ツイッターのフォロワー数は約23万人もいました。さすが有名人…!
では、フォロワーの情報も見てみましょう。

アカウントのプロフィールを見てみると、”熊本”と所在地情報(赤丸)が記載してありますね。この項目はロケーションっていうらしいです。
ここからフォロワーの居住地を調べることで、どこの地域にYZファンが多いかが分かりそうですね。
ツイッターから23万人のデータを収集!
ツイッターのフォロワー情報を集めることが必要ですが、23万人のページを一人ずつ確認するのは大変ですよね。そこで、おすすめなのがスクレイピングです!!
スクレイピングをすると、いちいちページを開いてコピペしなくても膨大なデータを一括で取得できるんです。
便利な方法ですね~。それでは早速、フォロワーのロケーションをすべてスクレイピングしてみましょう!YZファンの皆さんはどこに住んでいるんでしょうか…!

ロケーションデータ233,486件のスクレイピングが完了しました!ロケーションの設定は任意のため、設定していないアカウントは空欄になっていますが、このデータを見る限りでも幅広い地域にファンがいることが分かります。
データを見やすく整形、可視化
データがこのままでは、国名、都道府県名、市区名、空欄などバラバラの状態ですね。都道府県が記載されている場合は地域名に置き換え、データを整形していきましょう。
①都道府県のテキストを各地域名に置き換える
②検索で各地域の数を調べる
この手順によって、地域別にファンの数を集計したグラフです。

関東地方のフォロワーがダントツで11,849人、四国地方が最下位で540人という結果になりました。四国地方は4県しかないこととアリーナ会場がないことから、近隣の中国地方と合体させると約2,000人になりましたが、順位は変わりません。
この順位から考えると、中国・四国地方の会場がねらい目でしょうか!
ちょっと遠いけどツアーには行きたいしこの地域の会場に応募してみよう!
膨大なデータはスクレイピングで!
今回はツイッターからアカウントのロケーションデータをスクレイピングしました。スクレイピングは23万件もすぐにデータ化できて優秀ですね。地域別のファン数が分かったことで、ねらい目の会場も予想できました。
さっそく応募する中国・四国地方の会場情報もチェックしないと!ライブ楽しみだなぁ~。