
今回は、数々の企業におけるIT関連の案件を扱っていらっしゃる戸田総合法律事務所の中澤弁護士をお招きして、企業が行うWebスクレイピングに潜む法律的観点でのリスクについて解説していただきます。

皆様はじめまして、弊所は埼玉、東京、福岡の三拠点を設け、全国のお客様に対してインターネットやITに関する法律問題に関するアドバイス、紛争解決を提供しております。事務所の代表である私自身は特にインターネット関係の法律問題を専門としています。
どうぞ、よろしくお願いします。

Webスクレイピングについて調査しているレイコです。
中澤先生、よろしくおねがいします!
Webスクレイピングは違法?

まず気になるのは、スクレイピングについて調査を行っていると「スクレイピング 違法」というキーワードにたどり着くことがあります。なぜスクレイピングが違法じゃないか、という議論がなされるのでしょうか。

Webスクレイピングは他のサイトからデータを収集してくるので、まるで人のものを奪っているようなイメージが先行してしまっているからではないでしょうか?しかし、事実としてWebスクレイピングは単なる情報収集の手段ですのでそれ自体が違法ということはありません。
もちろん、Webスクレイピングを行う目的や態様、Webスクレイピングで得たデータの取り扱い方によっては、著作権法、個人情報保護法に抵触してしまう恐れがあります。また場合によっては、刑法に違反してしまい刑事事件になってしまうことがあります。やり方や目的によっては違法となってしまうこともあるというのが正確です。
Webスクレイピングが違法になる4ケース


大きく分けてどんな場合にWebスクレイピングが違法になるのでしょうか?

Webスクレイピングを行う際に違法になってしまう場合は大きく分けて以下の4つあります。
✕ サーバーに負荷をかけてしまった場合
(刑法233条偽計業務妨害罪、同234条電子計算機損壊等業務妨害罪)
特定のWebサイトへ過度にアクセスすることを直接的に禁止する法律はありませんが、過度にアクセスすることによってそのWebサイトが重くて閲覧不可能になった、となれば偽計業務妨害罪や電子計算機損壊等業務妨害罪にあたる可能性があります。犯罪にあたるかどうかは、相手のサーバーへの負荷の程度、業務に与えた影響などを総合的に判断され、1日何回まではOK、といった明確な基準はありません。
✕ 個人情報を同意なく取得、公開、売買してしまった場合
(個人情報保護法違反)
平成29年の改正個人情報保護法施行により、ほとんどすべての事業者が「個人情報取扱事業者」として個人情報保護法の適用を受けることになりました。この法律では、個人情報※1を取得する際には、利用目的を本人に明示する必要があります。スクレイピングで個人情報に該当する情報を取得する場合、各人に個別に利用目的を明示することは現実的ではないでしょうから、プライバシーポリシー等で利用目的をあらかじめ公表しておくことが違法とならないためには重要となります。また、人種や病歴等、個人情報の中でも特に取り扱いに配慮を要する「要配慮個人情報」については、あらかじめ本人の同意を得ないで取得することは原則できません。スクレイピングによって要配慮個人情報を収集することは原則違法といえます。
また、Webスクレイピングで得た個人データを、公開したり売買したりすることは第三者提供に当たるため、あらかじめ本人の同意を得ていない限りは原則違法です。(個人情報保護法23条)
他方で、生存する個人に関する情報ではないもの、例えば法人に関する情報、特定の業界に関して企業リストを作成し、業界分析を行うような場合には個人情報保護法の規制は及びません。
(個人情報保護委員会「個人情報保護法ハンドブック」より)
✕ WebスクレイピングするWebサイトの利用規約に違反する場合
利用規約は、あるウェブサイトを利用する際の約束事であり、利用規約に同意して当該サイトを利用している者との間で拘束力が発生することになります。
仮に、利用規約でWebスクレイピング・クローリングを禁止されているサイトに、その利用規約に同意しているにも関わらず、それを無視してスクレイピング等を行った場合には、利用規約違反となり、民事上の責任として、債務不履行責任や不法行為責任を負う可能性があります。
なお、会員登録などせずともなくだれでも閲覧可能なウェブサイトについては、利用規約に同意せずWebスクレイピングを実施すれば、利用規約違反の問題にははなりませんが、サイト側でAPIを用意している場合などは指定の方式を遵守することが望ましいでしょう。
✕ 著作権を無視した利用、複製等を行ってしまった場合
(著作権法21条など)
著作権とは思想や感情を創作的に表現したもの(著作物)についてそれを独占できる権利のことを言います。 著作権法のいう創作性等は高度なものが要求されるわけではありませんから、web上にあるコンテンツのほとんどは誰かの著作物であり、誰かの著作権があると言えます。
著作物を利用するためには、原則として著作権者の同意を得なければなりません。著作物の利用には、データをコピーして保存する行為も含まれますので、Webスクレイピングによってweb上のデータを収集して保存する場合も、著作権者の同意を得なければならないのが原則です。

これらのような点でWebスクレイピングには法的リスクがありますので、企業として行う場合は4つのそれぞれの観点についてどのようにリスクを回避するかを定めておくと良いでしょう。

先生のご説明でWebスクレイピングが違法の場合が整理できました。ですが、最後の著作権の問題は、結局の所スクレイピング元サイトに連絡して、同意を得ることが必要ということになりますか・・?けっこうハードルが高いですね。

おっしゃるとおり、本来であれば著作物の作者と連絡をとり、目的のためにWebスクレイピングをすることを同意しなければいけないのですが、これではデータを直接もらうことと同じです。
しかし、著作物の利用のすべてに著作権者の同意を得るというのは現実的ではありませんので、著作権法が一定の場合の例外を定めています。著作権法は国内のAI・ビッグデータによるイノベーションを促進するため、他者の著作権の利用範囲を年々広げて来ており、確認を取らなくても、著作物が自由に使える場合が増えています。Webスクレイピングのケースで該当しうる例外規定としては、直近の法改正で整備された著作権法30条の4(著作物に表現された思想又は感情の享受を目的としない利用)や、著作権法47条の5(電子計算機による情報処理及びその結果の提供に付随する軽微利用等)があります。
著作権を侵害せずにWebスクレイピングしたデータを使うには
〇 検索エンジン(所在検索サービス)
Webスクレイピングの技術を使用した最も有名なサービスとしてGoogleやYahoo!をはじめとする検索エンジンがあります。この検索エンジンのための利用や検索に付随する著作物の題名等の提供は認められています。(電子計算機による情報処理及びその結果の提供に付随する軽微利用等:第47条の5)
〇 情報解析サービス、またはAIエンジンの作成
Webスクレイピングしたものが著作物であったとしても、そのデータを自分で解析し、新たな価値を生み出すことは認められています。多数のクチコミを解析し、その結果を商品開発にフィードバックする場合などは、著作権法30条の4が定める「情報解析の用に供する場合」として認められるでしょう。
〇 情報解析のための複製等(第47条の7)
コンピュータ等を用いて情報解析※2を行うことを目的とする場合には,必要と認められる限度において記録媒体に著作物を複製・翻案することができます。 ただし,情報解析用に広く提供されているデータベースの著作物については,この制限規定は適用されません。
上で説明した箇所をしっかりと押さえていれば、Webスクレイピングが違法になることはほぼないのですが、捜査機関に違法だと判断された例があるためハードルを挙げてしまっていると考えられます。ケーススタディのため、紹介しておきます。 この事件に関して、のちに岡崎市図書館側は同システムの不備が原因であることを認めていますが、男性が逮捕されたという事実は残ってしまいました。 偽計業務妨害にあたると判断されてしまったということは、故意だと認定されたということですか? そうなんです。大量のアクセスを高速に行った場合、サービスがダウンしてしまうことはその技術があるものであれば十分に予測できただろう、と判断されたようです。1秒1アクセスで高速とは思えませんが、捜査機関はそう考えたようです。 実際のところ悪意はなかったということも相まって、世の中的には判断が難しい、グレーな行為と捉えられるようになったのかもしれませんね。 そうですね。ですから特に企業としてWebスクレイピングを行う場合は経験豊富なプロフェッショナルのPigDataに任せることがオススメなのです。経験に基づき責任持ってWebスクレイピング業務を行ってもらえるため、うっかり偽計業務妨害になってしまった、ということはありません。 すでにデータ収集を行うことを検討しているかたは、お気軽にお問い合わせくださいませ。
実際に起こったWebスクレイピングの事件
岡崎市中央図書館事件
2010年3月ごろ、岡崎市立図書館のウェブサイトの蔵書システムにアクセスできないとの苦情があったことから、同図書館が不正アクセスについて通報し、蔵書システムに対してWebスクレイピング行っていた男性が、同年5月25日高頻度のリクエストを故意に送りつけたとして偽計業務妨害の容疑で逮捕されました。 実際には1秒1アクセス程度で、サーバーに対して攻撃するような高負荷を与えるものではなかったが、図書館のシステムが旧式であったこともあり、閲覧障害が発生しました。 男性に悪意はなかったものの、犯罪が成立しないことを意味する「嫌疑不十分」ではなく、「起訴猶予」という結果となりました。
PigDataでは、企業がWebスクレイピングをビジネスとして行う際に法的なリスクを回避できるようスクレイピングポリシーを遵守してデータ収集事業を行っています。お客様には安心してご依頼、データの利用を行っていただいています。スクレイピング法律資料ダウンロード