
データを活用して重要な意思決定を行う企業が増えています。しかし、自社にある内部データだけでなくインターネット上の外部データを活用する場合、著作権を侵害してしまわないか注意が必要です。
本記事では著作権の要件や著作物の範囲、生成AIやスクレイピングを利用した際の注意点を細かく解説します。
データに著作権はあるのか
データに関する著作権の扱いは、そのデータの性質や作成方法によって異なります。例えば、気温の記録やスポーツのスコアなど単純な事実やデータには著作権が存在しません。しかし、データそのものではなく、データを収集し整形したデータベースには著作権が発生する可能性があります。
著作物とは
著作物とは一体なんでしょうか。
以下で要件や例外、保護を受ける著作物について解説します。
著作物の要件
著作権法では「思想又は感情を創作的に表現したものであって、文芸、学術、美術又は音楽の範囲に属するもの」とされています。なお、思想や感情は言葉や音、画像などによって具体化され、他人が認識できる形であることが必要です。
似た権利として特許権がありますが特許権は「アイデア」を保護し、著作権は「表現」を保護しています。
権利の目的とならない著作物
著作物はアイデアそのものではなく、アイデアが表現された具体的な形を保護対象とします。したがって、発明やアイデア、システムなどはそれが特定の形で表現されていない限り著作権の対象外です。この他にも、公文書、事実やデータは著作物として認められません。
保護を受ける著作物
著作権法で例示されている著作物には「一般の著作物」「二次的著作物」「編集著作物」「データベースの著作物」「共同著作物」があります。
ここでは代表して「一般の著作物」をさらに紹介します。一般の著作物はさらに以下9つに分類されます。
- 言語の著作物
- 音楽の著作物
- 舞踏、無言劇の著作物1
- 美術の著作物
- 建築の著作物
- 地図、図形の著作物
- 映画の著作物
- 写真の著作物
- プログラムの著作物
ネット上にあるデータに著作権はあるのか
インターネット上にあるデータにも著作権は存在します。著作権法は対象がどのように公開されているか(例えば、紙の本、CD、インターネット上など)には依存しません。重要なのは作品が著作権の保護を受ける要件を満たしているかどうかです。
テキストの場合
オリジナルの創作物であり、創造するために労力が投じられた表現であれば著作権はあります。したがって、無断でテキストをコピーしたり、再配布したりすることは著作権侵害となり得ます。
画像の場合
画像もオリジナルの創作物であれば著作権があります。したがって、商業利用や再配布の場合は著作権侵害にならないよう注意が必要です。
音楽の場合
音楽も著作権の対象です。特に明記されていない限りは、利用する際はライセンスを取得するか利用許可を得る必要があります。
映像の場合
映像もオリジナル作品であれば著作権があります。映像自体だけでなく、その中に含まれる脚本や音楽、セットデザインなども対象となるため注意が必要です。
生成AIによるデータの著作権
生成AIによるデータの著作権はまさに議論されている内容であり、まだ不確実性が高い状態です。あくまで2024年3月時点の情報としてご理解いただき、生成AIで生成したコンテンツの取り扱いには十分ご注意ください。
生成AIに関わる著作権法
現行著作権法は、人間が創作した作品を保護の対象としています。そのため、AIによって生成されたテキスト、画像、音楽などの作品が著作権の保護を受けるかどうかはまだ判例がありません。AIによる創作物はそのプログラムを作成または操作した人間による創作行為と見なされ、著作権の保護を受ける可能性があります。しかし、AI自体を著作者と見なすことは一般に認められていません。
生成AIが活用する学習データの著作権
生成AIは大量のデータを学習することでコンテンツを生成しています。その学習したデータの中に著作権で保護されている著作物が混じっている可能性もあります。その場合、生成されたコンテンツに著作物が反映されてしまい、意図せぬ形で著作権を侵害してしまうことも考えられます。
スクレイピングしたWebデータの著作権
著作権法に抵触する場合
Webサイト上のテキストや画像などはそのコンテンツの作成者に著作権が帰属します。そのためこれらのコンテンツを無断でスクレイピングし、商業的に利用したり二次配付をしてしまうと著作権法に抵触します。日本ではあまり馴染みがないかもしれませんが、欧州では「データベース権」という考え方が存在し、データベースを無断でスクレイピングし利用することも著作権を侵害することになり得ます。
著作権法に抵触しない場合
スクレイピングした結果に著作物が含まれる場合でも、そのデータを情報解析したり、必要と認められる限度において複製・翻案することができます。例えば、Webサイト上の口コミ情報をスクレイピングで収集し、分析した結果を商品開発に活かす行為は著作権法30条の4が定める「情報解析の用に供する場合」として著作権法に抵触しません。

データの共有と保護
オープンデータの利用と著作権
スクレイピングを活用してデータ収集を行う前に、まずはオープンデータに必要とするデータがないか確認しましょう。オープンデータとは政府や地方公共団体、一般事業者が公開している官民データです。二次利用を前提として整形されたデータであるため、誰でも加工や編集することが認められており、活用にあたっては比較的安心です。代表的なものとして総務省が運用する「データカタログサイト」などがあります。
なお、オープンデータであっても、コンテンツの中には第三者が著作権を有するデータが含まれる場合があります。オープンデータだからといって権利侵害を全く気にしなくて良いわけではありません。注意しましょう。
データセキュリティとプライバシーの問題
スクレイピングで個人情報を含むデータを取得する際は注意が必要です。個人情報を取得する際は本人に対し利用目的を明らかにすることが義務付けられています。スクレイピングの対象としたWebサイトのプライバシーポリシーや個人情報保護方針を確認し、「第三者への提供」等の文言があるか確認しましょう。
なお、信条や病歴など特に配慮が必要な個人情報はプライバシーポリシーや個人情報保護方針を公表しているだけではなく、本人の同意が必要になります。
まとめ
著作権の扱いはそのデータの性質や作成方法によって異なり、著作権があるものもあればないものもあります。そのため、外部データとしてWebデータを活用する場合は慎重に取り扱わなければなりません。例えば、スクレイピングでWebサイトからデータを収集すればデータにも扱い方に関する法律があります。そもそもスクレイピングをすること自体に関わる法律もあります。
著作権侵害など考慮すべき法律は多いため、Webデータを活用したい場合は専門家に相談することをおすすめします。PigDataではスクレイピングなどWebデータを活用したサービスを提供しています。お気軽にご相談ください。