
執筆:弁護士 森川 そのか( AI・データ(個人情報等)チーム )
今年2023年は、3月15日のOpenAIによるChatGPT4の公開をはじめとして、様々な企業がこぞって生成AIの開発及び生成AI搭載サービスのリリースを試みており、まさに生成AI戦国時代といえるのではないでしょうか。
本稿では、そのような状況を踏まえて、生成AIの著作権法上の論点についてまとめてみました。
1.はじめに
生成AIとは利用者がプロンプトを入力すると、一定の文章・画像・映像・音楽等をAI自身が生成し、出力してくれるというものです。
他方で従来のAIは文章・画像その他の予め学習したデータの傾向に基づいて、正解・不正解の識別や、統計データに基づいた将来予測等をする、というものでした。(いわゆる「識別AI」「予測AI」等)
この「生成」過程をAIが担えるようになってから、AIが人間と同じように表現物をアウトプットするようになったため、今までも問題視されていた「AIと著作権法」の問題は更に注視されるようになってきました。
2.生成AIと著作権の関係
(1) 概要
文化庁の公式見解によると、
「AI開発・学習段階」と「生成・利用段階」では、行われている著作物の利用行為が異なり、関係する著作権法の条文も異なります。そのため、両者は分けて考える必要があります。
とされています。
そこで、本稿でも、①開発・学習段階と②生成・利用段階について分けて解説していきます。
(参考文献:「AIと著作権」
( https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf )
(2) 開発・学習段階
ア 権利侵害該当性
(1) 依拠性・類似性(※後述)
著作権侵害は、権利侵害があるとされる著作物(以下、「著作物B」とします。)の原著作物(以下、「著作物A」とします。)に対する依拠性・類似性が認められる場合に成立します。依拠性・類似性については生成・利用段階で特に問題となるため後述します。
(2) 侵害行為
開発・学習段階で、学習用データセットに著作物を入力する行為は著作物の複製にあたるので、複製権侵害(21条)が成立し得ます。
イ 権利制限規定の適用
(1) 30条の4の適用があること
生成AIの学習・開発のように、情報解析の用に供する目的で著作物を利用する場合等については、「著作物に表現された思想又は感情の享受を目的としない利用」に該当するため、著作権侵害となりません。(法第30条の4)
参考:著作権法
(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 省略
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 省略
この規定は、平成30年の著作権法改正により、柔軟な権利制限規定を設ける一環として制定されました。
a.「享受を目的としない」
著作権法は、著作者の経済的利益を保護する法律ですが、ここでいう経済的利益とは著作物によって知的・精神的欲求を満たす効用を得られることの対価として支払われる利益のことです。
したがって、法第30条の4の「享受」とは、著作物の視聴等を通じて、視聴者等の知的・精神的欲求を満たすという効用を得ることに向けられた行為をいいます。「享受」といえる行為の例としては、
・文章の著作物の場合は、閲読すること、
・音楽・映画の著作物は、鑑賞すること
・プログラムの著作物であれば、実行すること
をいいます。
生成AIの学習・開発行為は上記のどれにも当てはまらず、知的・精神的欲求を満たすものではないので「享受を目的としない」といえます。
したがって、著作物を開発・学習行為に利用することは原則、著作権法30条の4の権利制限規定が適用されるため、著作権者の許諾無しに行うことが可能です。
b.「不当に害する」こととなる場合
もっとも、但し書きにあるように既存の著作権者の利益を不当に害することとなる場合は本条の規定の対象とはなりません。
「不当に害する」といえるかについては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、最終的には司法の場で個別具体的に判断されるようです。
文化庁はこの点について、例として、
「情報解析用に販売されているデータベースの著作物をAI学習目的で複製する場合など」
を挙げています。
データベースの著作物性は、データベースの「情報の選択又は体系的な構成に創作性がある」場合(著作権法12条の2)に認められます。そして、そのデータベースが学習・開発のために売買される場合は、ここに著作物の利用市場があるといえます。
その場合に、このデータベースを無断で学習に使用できてしまうと、データベースの著作物の利用市場を害するため、データベースの著作権者の権利を「不当に害する」場合に該当します。したがって、権利制限規定が適用されず、著作権侵害が成立します。
他方で、データベースに含まれる文章や画像などの著作物については、その利用市場はその文章や画像が掲載されている媒体の販売や配信等に認められます。データベースの無断学習行為によって、データベースに含まれる文章や画像の著作物の利用市場の侵害は起こりません。そのため、データベースの中身の部分については原則通り権利侵害が問題とならないのではないかと考えています。
ウ 小括
開発・学習段階では、学習行為時に享受目的が併存している等の事情が無い限りは権利制限規定が適用され、著作権者の許諾なく学習行為ができるのではないかと思います。
もっとも、30条の4の誤った解釈により学習用教材の無断使用をすることなどの無いように留意が必要です。
他方で、学習用教材を製作・販売する事業者は文化庁の例示によればその販路が脅かされないような解釈がなされているともいえそうです。
(3) 生成・利用段階
ア 権利侵害該当性
(1) 依拠性
a.依拠性とは
「依拠」とは、「既存の著作物に接して、それを自己の作品の中に用いること」をいいます。
例えば、過去に目にした既存のイラストを参考にこれと類似するイラストを制作した場合や、広く知られた有名な楽曲に類似する楽曲を制作した場合は依拠性が認められます。
ここで、既存著作物を「著作物A」、著作権侵害を疑われている著作物を「著作物B」とします。依拠性の判断にあっては、著作物Bの著作者が制作時に著作物Aを知っていたか(著作物Aに接する機会はあったか、著作物Aは著名だったか)、著作物Bと著作物Aの同一性の程度、著作物Bの製作の経緯等を考慮します。
b.生成AI特有の問題点
生成AIの場合は、例えば利用者が著作物Aを全く知らないのに著作物Aに類似した著作物Bが出力されてしまう可能性があります。
また、利用者が著作物Aを知っていたが、特にこれに類似するものを出力する意図は全くなかったにもかかわらず著作物Aと類似する著作物Bが出力される可能性もあります。
このような場合に著作物Bに著作物Aに対する依拠性が認められるかについては未だ結論が出ていません。
また、例えば学習済みモデルが著作物Aを学習していた場合とそうでない場合とで依拠性の判断の結論が変わるのかといった問題もあります。
(2) 類似性
「既存の他人の著作物と同一、又は類似している」(=類似性がある)」というためには、他人の著作物の「表現上の本質的な特徴を直接感得できること」が必要です。
そして、類似性が認められるには著作物Aと著作物Bの「創作的表現」が共通していることが必要であり、アイディアなど表現でない部分、又は創作性がない部分が共通するにとどまる場合は、類似性は否定されます。
(3) 侵害行為
出力される生成物である著作物Bが既存の著作物Aと同一か軽微な違いにとどまる場合は、複製権侵害になります。また、著作物Aに創作性が付与され一部が改変されている場合などは翻案権侵害、著作者人格権である同一性保持権侵害の可能性があります。
さらに、生成された著作物Bがネット上に残る場合、著作物Aの公衆送信権侵害になる可能性もあります。
イ 権利制限規定の検討
生成・出力段階では、かかる段階に特有の権利制限規定は無いため、私的利用や引用等に該当しない場合は著作権侵害が成立します。
3.事業者がうっかり著作権侵害をしないために
(1) 開発・学習段階
ア 30条の4に該当する方法で行うこと
(1) 享受目的を併存させないこと
例えば、既存著作物を学習した学習済みデータセットを一般公開する場合は、そこに含まれる著作物を不特定多数の人が閲読・鑑賞できてしまうため、享受目的が併存している場合といえそうです。これは「享受を目的としない」といえません。
事業者は学習済みデータの管理方法を工夫し、他の用途に用いないことをお勧めします。
イ 既存の著作物の著作権を不当に害する態様で行わないこと
上述のとおり、例えば学習用データベースとして販売されているものに関しては、これを無償で学習のために複製したり事業者間で使い回したりすることは「不当に害する」に該当するため避けたほうが良いと思います。
他方で、学習用データベースを販売される事業者は、データベースに関して発生する自社の権利の範囲を自社でしっかり把握し、利用規約や契約書などに明記することでデータベースへのフリーライドを防ぐことが必要かつ有効な方法といえそうです。
(2) 生成・利用段階
ア 権利制限規定に該当する方法を採用すること
著作権法では30条から50条にかけて権利制限規定が規定されています。アウトプットがこれらの規定に該当するような座組であれば著作権侵害を構成しないことになります。
例えば、私的利用や引用の要件を検討すること等が考えられます。
イ 著作物性の無いものを生成すること
著作権侵害の要件の一つである類似性が認められるには著作物Aと著作物Bの「創作的表現」が共通していることが必要です。仮に生成物に著作物性が無い=創作的部分が無いのであれば、生成物について原著作物の創作的部分が類似するということはないので著作権侵害を構成しないといえます。
(1) 出力する文章をありふれた表現に限定すること
表現上の創作性がなく、定石的な表現は「ありふれた表現」として著作物性が否定されてきました。文章生成AIであれば、出力する言葉を短くする、または汎用性の高い言い回しにする、といった設計にすることで著作権侵害が生じる可能性は抑えられそうです。
(2) アイディア・コンセプトのみ出力すること
抽象的なアイディアは保護の対象とならないので、生成AIをアイディア出しに利用する・させるという方法は著作権侵害を回避しつつ生産的な使用をする上でも非常に効果的な方法といえそうです。
(3) 応用美術・実用品等の判例・裁判例の考え方をうまく活用すること
応用美術・実用品等の中には著作物性が否定されてきたものもあります。このような判例・裁判例を参考にしながら侵害行為を回避する方法もあるかもしれません。
ウ 学習用教材にこだわること
(1) 前提
仮に学習用教材に著作物が紛れ込んでいなくとも、依拠性の判断がされ得る場合があることについては2(3)ア(ア)で述べたとおりですので、留意が必要です。
しかし、その場合に著作権侵害となる生成物が出力されるケースは、利用者が既存の著作物に似せるためにプロンプト入力をかなり工夫した場合に限定されるのではないでしょうか。そのような場合、事業者側としては自社が著作権侵害行為を行っていないことを主張する余地はありそうです。
(2) 学習用教材を限定すること
例えば、学習用教材を著作物でないもの、著作物としての保護期間が切れたもの、著作権者からの許諾を得たもの、又は自社で制作した著作物などに限定する事が考えられます。
もっとも、上述しましたが、著作権法が生成AIの学習・入力段階と生成・出力段階を分けて考える方法を採用している以上、出力された生成物の著作権侵害の有無についてどの程度学習・入力したデータの内容を考慮するかについては未知数です。この点についても、文化庁は定まった見解を出していないようです。この点については事業者のサービス内容やビジネスモデルから個別に検討していく必要があると思います。
4.終わりに
生成AIに関する著作権法上の解釈については未知な部分が多いです。弊所では引き続きこの論点及び生成AIに関連する他の法令の解釈等についてもさらに研究・調査を深めてまいります。
監修
弁護士 阿久津 透
(個人情報保護法、電気通信事業法といったデータ・通信に関する分野を中心に担当。 データ分析やマーケティング施策実施における法規制の対応、情報漏えい対応などデータの利活用に関する実務対応を行っている。 その他、スタートアップファイナンス、企業間紛争も対応。)