
Amazonは世界最大規模の通販サイトであり、非常に多くの情報が掲載されています。そのため、これらの情報を収集するにあたって「スクレイピング」を活用したいと考える人がいるのではないでしょうか。
スクレイピングは、Web上の情報をツールで収集する方法であり、Amazonの情報もツールならば効率よく取得できます。ただ、スクレイピング行為を禁止しているWebサイトもあるため、Amazonの利用規約を踏まえながら、スクレイピングできるかを解説します。
目次
スクレイピングとは
スクレイピングとは、Webサイトに掲載されている特定の情報だけを取得するプログラミング技術です。また、スクレイピングのサービスによっては取得するだけではなく、集計や分析することを含むケースもあると考えましょう。
一般的にスクレイピングでは、Webサイトに表示されている情報以外も取得します。例えば、画面には表示されない、各種コードや画像データURLなども情報収集の対象となるのです。
Amazonはスクレイピング禁止?
Amazonの情報を収集したい場合には「規約としては問題ないのか」と気になるでしょう。まずは、問題視されないのかについて解説します。
Amazonの規約
Amazonの利用規約には、スクレイピングに関連する事項が定められています。具体的に抜粋すると以下のとおりです。
本規約およびサービス規約の遵守を条件とし、アマゾンまたはコンテンツ提供者は、アマゾンサービスを限定的、非独占的、非商業的および個人的に利用する権利をお客様に許諾します(譲渡およびサブライセンス不可)。この利用許可には、アマゾンサービスまたはそのコンテンツの転売および商業目的での利用、製品リスト、解説、価格などの収集と利用、アマゾンサービスまたはそのコンテンツの二次的利用、第三者のために行うアカウント情報のダウンロードとコピーやその他の利用、データマイニング、ロボットなどのデータ収集・抽出ツールの使用は、一切含まれません。
Amazon.co.jp利用規約
上記の内容を踏まえると、スクレイピングのようにロボットによってAmazonの情報を収集することは、規約違反だと考えられます。
規約が適用される条件
利用規約の内容を踏まえて「Amazonではスクレイピングできない」と理解する人が多いでしょう。ただ、実際にはこの解釈が正しいとは限りません。
経産省が発表している「電子商取引及び情報財取引等に関する準則」によると「サイト利用に際して、利用規約への同意クリックが要求されており、かつ利用者にいつでも規約内容が開示されている場合は利用規約が契約に組み入れられる」とされています。
Amazonにログインすると、その時点で利用規約に合意したとみなされます。言い換えると、ログインせずに収集できる範囲内であれば、スクレイピングは違反にならないのです。
とはいえ、大量のアクセスなど負担をかける行為は、問題視される可能性があります。訴えられる可能性もあるため、その点は注意が必要です。
スクレイピングが禁止されているか調べる方法
スクレイピングで情報を集めたいならば、禁止されていないかの確認が重要です。禁止されている状態でスクレイピングすると、訴えられるなどの危険性があります。
Webサイトの規約をみる
スクレイピングが禁止されているかどうかは、Webサイトの規約で確認しましょう。大手サイトを中心に、Webサイトの利用規約が掲載されているはずです。「スクレイピング」というキーワードや関連する表現がないか確認してみましょう。
なお、すべてのWebサイトに利用規約が存在するとは限りません。そのような情報が一切公開されていないサイトも見受けられます。記載がない場合、利用規約上はスクレイピングが問題になりませんが、何かしらの指摘を受けた場合は対応するようにしましょう。
robot.txtをみる
Webサイトには、robot.txtと呼ばれるファイルが設置されていることがあります。プログラムによるアクセスでは、こちらのファイルを読み取るようになっているのです。そして、プログラムがどのフォルダへアクセスして良いかなどが記載されています。
事前にrobot.txtの内容を確認することで、プログラムによるアクセスが許可されているかどうかの把握が可能です。もし、アクセスが禁止されているならば、実質的にスクレイピングが認められていないと理解しましょう。
AmazonのAPI
Amazonは「Amazon Product Advertising API」と呼ばれるAPIを提供しています。これは、Amazonの商品情報やセール情報などをプログラムで取得できる仕組みです。多くの商品を検索することも、任意の商品を検索してピンポイントに情報を得ることもできます。
APIは、スクレイピングのように外部の機能ではなく、Amazonが公式で提供しているものです。そのため、ルールの範囲内であれば、どれだけ利用しても問題にならないという魅力があります。
ただ、データを収集するためにPythonなどのプログラミングが必要となったり、1時間あたりの取得制限が設けられていたりします。少々、使い勝手が悪い部分があるため、その点は理解しておくべきです。
Amazonをスクレイピングする際の注意点
ログインしていない状態であれば、Amazonのスクレイピングは規約違反でありません。ただ、法的な観点を中心に注意点があるため、それぞれ理解しておきましょう。
偽計業務妨害罪
特定のWebサイトへ過度にアクセスすることを直接的に禁止する法律はありません。ただ、サーバーへの負荷の上昇によってWebサイトが閲覧できないなどの状態に陥ると、偽計業務妨害罪にあたる可能性があります。
ただ「どの程度の影響を与えると犯罪として扱われるか」の基準はありません。その時々によって判断される部分であるため、負荷を与えすぎないことが大切です。
電子計算機損壊等業務妨害罪
Webサイトに負荷を与えると、偽計業務妨害罪ではなく電子計算機損壊等業務妨害罪に問われる可能性もあります。どちらも、Webサイトを正常に閲覧することができず、業務を妨害した時に適用される可能性があるものです。
ただ、偽計業務妨害罪と同様に「どの程度の負荷をかけると業務妨害にあたるのか」という明確な基準はありません。スクレイピングされた側が被害を申告し、その内容によって、罪に問われるかどうかが変化します。
著作権
Webサイトの情報は、所有者の著作物です。つまり、そのデータを勝手に別サイトに掲載するなどすれば著作権法に抵触します。そもそも、Web上に公開されている情報は、大半に著作権が存在します。そのため、原則として著作者の同意がなければ第三者の利用はできません。スクレイピング行為やその情報の活用は、第三者の利用にあたるため、禁止されている場合は事前の許可申請が求められます。
危険なのはAmazonだけじゃない
今回はAmazonについて解説しましたが、同様にスクレイピングを禁止しているWebサイトが存在します。そのため、スクレイピングによる情報収集を考えている場合には、必ず規約やrobot.txtを確認しましょう。これを怠ってしまうと、訴えられるなどのトラブルになりかねません。
また、そもそも専門的な知識なくスクレイピングすることは「危険」という考え方があります。法的なトラブルを避けるためにも、スクレイピングは専門の代行業者に任せると安心です。
まとめ
Amazonは規約でスクレイピングを禁止しています。そのため、基本的にはスクレイピングでの情報収集ができません。規約違反で、何かしらのペナルティを受ける可能性があります。ただ、経産省の見解によると、利用規約はログインなどのアクションによって成り立つものです。つまり、ログインしていない状態であれば、スクレイピングも問題視されないと考えられます。
とはいえ、専門的な知識なしにスクレイピングすると、訴えられてしまうかもしれません。PigDataはスクレイピングを専門としてWebデータの収集から活用まで支援しています。スクレイピングによる実績も多く、法律面に関して弁護士からの監修を受けているため、安心してご利用いただけます。
スクレイピングにお悩みの際は是非ご相談ください。