Ⅰ. はじめに
近時、生成AIと著作権を巡る問題は、著作権法の分野では最も関心の高いトピックとなっています。日本でも、最近の報道によれば、複数の大手新聞社が生成AIを用いた検索サービスを提供する米国のパープレキシティを相手方として、著作権侵害などを理由として訴訟を提起したことが社会的な耳目を集めています1。一方、米国では、既に生成AIと著作権を巡る訴訟が多数提起されており、これらの訴訟の中で、生成AIの学習のために既存の著作物を利用することはフェアユースに該当するか否かが主な争点の一つになっています。そして、本年に入ってから、いくつかの事件でフェアユースの該当性の争点について判断する判決が出されはじめています。
今回のニュースレターでは、米国におけるフェアユースの法理を概説した上で、これらの事件のうち、フェアユースを認めた①Bartz et al v. Anthropic PBC事件(2025年6月23日、北カリフォルニア連邦地裁)と②Kadrey v. Meta Platforms, Inc.事件(2025年6月25日、北カリフォルニア連邦地裁)の2つの事件の事案と判示内容を紹介します。
Ⅱ. フェアユースの法理について
日本の著作権法は、包括的・一般的な要件の下で著作物の利用を許容する権利制限規定は設けておらず、個別の要件の下で著作物の利用を許容する形式の権利制限規定を設けています。生成AIの学習に著作物の利用する場合に関係する権利制限規定としては、例えば、著作物に表現された思想又は感情の享受を目的としない利用について定めた30条の4やコンピュータによる情報処理及びその結果の提供に付随する軽微な利用等について定めた47条の5があります。これに対し、米国の著作権法は、同法107条において、包括的・一般的な権利制限規定として、フェアユースの法理を定めています。
フェアユースの判断においては、主に、①使用の目的及び性格、②著作物の性質、③著作物全体との関係における使用部分の量及び実質性、④著作物の潜在的市場や価値への影響という4要素が考慮されます。
より具体的には、①においては、トランスフォーマティブ(transformative)な使用か、商業的な使用かという点が主要な考慮要素となります。元の作品の代替物にとどまらず、新しい表現、意味づけ又はメッセージにより元作品に変わる新たな目的又は異なる性質を付加したと認められるようなトランスフォーマティブな使用であれば、フェアユースを肯定する方向に働きます。使用の目的及び性格がよりトランスフォーマティブであるほど、商業的使用であることなどフェアユースを否定する要素の重要性は低くなるとされ、また、トランスフォーマティブであるほど当該複製物が市場における代替物となる可能性が低くなるため、著作物市場への影響(④)の判断にも影響を与えるとされています。②においては、芸術的著作物の場合は、創作性のある要素が大きく、保護範囲が広くなる一方、事実的著作物・機能的著作物の場合は、事実やアイデアの要素は保護を受けないため、保護範囲が狭くなるとされています。③においては、著作物を使用する量が少なく、かつ、使用が著作物の核心部分に及ばない場合には、フェアユースが成立する余地が大きくなるとされています。④においては、被告による使用が原告の著作物の既存市場又は潜在的市場(未だ作成されていない二次的著作物の市場が含まれる)を奪うものである場合には、フェアユースが成立しないとされています。上記の要素のうち、④の要素は最も重要な考慮要素とされる一方、その重要性は他3要素における立証の程度によるとされています。
Ⅲ. Bartz et al v. Anthropic PBC事件について
1. 事案の概要
Xら(3名の作家とその関連法人)が、生成AIサービスを提供するYがXらに無断で、Xらの著作物を含む多数の書籍を、Yが開発するLLM(大規模言語モデル)の訓練に使用したことがXらの著作権を侵害したとして、Yを提訴しました。Yは、Yの行為がフェアユースに該当することを理由に略式判決を申し立てました。
Yは、書籍を購入した上でスキャンしてデジタル化(PDF化)する方法及び海賊版サイトから書籍のデータを無償でダウンロードする方法により、Xらの著作物を含む多数の書籍のデータ(以下「本件書籍データ」といいます。)を取得した上で、本件書籍データの全てを用いて内部データベース(central library。以下「中央データベース」といいます。)を構築し、本件書籍データを管理していました。YのLLMの訓練には、中央データベースに保管されている本件書籍データから選定された複数の書籍データのセットが使用されました。
2. 本判決の判断
(1)「使用」の特定
フェアユースの該当性を判断する前提として、著作物の使用行為が単一のものと評価されるか、複数の使用行為と評価されるか特定する必要があります。
Xらは、Yの使用は、本件書籍データを使用して中央データベースを構築することと、本件書籍データをLLMの訓練に使用することの少なくとも2つの使用行為があったと評価されるものであり、それぞれ別個独立に正当化される必要があると主張しました。一方、Yは、Yの使用は、中央データベースの構築も含めLLMの訓練という目的に向けられた単一の行為であると主張しました。
本判決は、使用行為の特定は、使用者の主観的な意図を基準にするのではなく、使用者が著作物を用いて何をしたかという客観的な判断によるべきという基準を示しました。その上で、Yが、LLMの訓練に使用しないことを決めたものも含め本件書籍データの全てを中央データベースに保管し続けていた等の事情から、本件書籍データを使用して中央データベースを構築したことがLLMの訓練のための使用の一部と評価することはできないと認定し、Yの主張を排斥しています。
以下では、本件書籍データをLLMの訓練に使用したことがフェアユースに該当するかという争点に関する判断を中心に紹介します。
(2)第1要素:使用の目的及び性格
YのLLMがAIソフトウェアに組み込まれた際には、本件書籍データのコピーを出力することがないよう、同LLMの出力を制限するフィルタリングがなされていました。上記事実を前提に、本判決は、Yが本件書籍データを使用してLLMを訓練する目的及び性質は、本件書籍の単なる模倣や代替をすることではなく、書籍の読者が作家を目指すことと同様、新しい文章を生成することにあると認定しました。したがって、その目的及び性格は、トランスフォーマティブなものであり、その程度は極めて高いと判断しました。
Xらは、本件書籍データ使用の目的及び性質がトランスフォーマティブではないと主張する論拠の1つとして、(AIの訓練のための著作物の使用についてフェアユースを否定した)Thomson Reuters判決2を引用し、たとえ人間が行う場合は著作権侵害にならない行為であっても、コンピューターが行う場合は著作権侵害となると主張しました。しかし、本判決は、Thomson Reuters判決において問題となったAIが生成AIではないことが強調されていたことを指摘し、本件とは事案が異なるとされました。
(3)第2要素:著作物の性質
本判決は、Y自ら、Xらの著作物に表現的要素があることを認めていること、本件書籍はその洗練された文章的表現を理由としてLLMの訓練に使用されたと認められることから、著作物の性質はフェアユース該当性の判断にあたりXらに有利に働くと判示しました。
もっとも、第2要素の主要な役割は、他の要素の評価を補助する点にあるとされ、フェアユース該当性の判断に与える影響は大きくないと判示しています。
(4)第3要素:著作物全体との関係における使用部分の量及び実質性
本判決は、著作物の使用が、使用目的に照らして合理的に必要と認められる量であったかという判断基準を示しました。その上で、LLMを訓練するための著作物の使用については、コピーにおいてどれだけの量と重要部分が使われたかではなく、それによって公衆にどれだけの量と重要部分が競合的な代替物として提供されるかが重要であると述べ、YのLLMを搭載したAIソフトウェアは本件書籍を出力しないことから、著作物の使用量は合理的であると判示しました。
Xらは、LLMの訓練に使用された本件書籍の量が極めて多く、また、Yは本件書籍を使用しなくともLLMを訓練できた可能性があるため厳密な意味でその必要性が認められないと主張しました。しかし、裁判所は、前者については、一般に著作物全体をコピーすることはフェアユース該当性の判断にあたり不利な要素になるとしつつ、上記理由からXらの主張を排斥しました。また、後者については、第3要素の判断に当たり求められるのは厳密な意味での必要性ではなくあくまで合理的な必要性であり、LLMの訓練には膨大な文章が必要であることから、ある特定の著作物の全体を訓練に使用することは合理的に必要であると判示しました。
(5)第4要素:著作物の潜在的市場や価値への影響
上記のとおり、第4要素は既存市場又は潜在的市場への影響を考慮要素とします。
本件では、YのAIソフトウェアが本件書籍の代替品や模倣品を出力することはないとのことであったため、生成AIの訓練目的での本件書籍の使用が、Xらの著作物自体の既存市場に影響することはなく、Xらもそのような主張はしませんでした。Xらが主張したのは、Xらの著作物と競合する作品が大量に生み出される可能性があるため、Xらの著作物の市場に影響するという点でした。
この点につき、裁判所は、Xらの主張する競合作品の増加可能性があると仮定しつつ、書籍を使用してLLMを訓練することを子供に作文を教えることに喩えた上で、著作権法の目的は独創的な著作物の発展を促すことにあり、Xらを競争から守ることではないとして著作権法の保護対象ではないと判示しました。
また、Xらは、LLMの訓練に使用する書籍のライセンス市場が新たに生まれつつあり、本件書籍の潜在的市場に影響すると主張しました。裁判所は、上記ライセンス市場が生まれつつあるというXらの主張が真実であると仮定しつつ、フェアユースに該当する著作物の使用は著作権者がコントロールできないことを理由に、上記ライセンス市場もまた著作権法の保護対象ではないと判示しました。
(6)結論
以上より、本判決は、LLMの訓練に本件書籍データを使用したことは、第2要素を除くすべての要素がフェアユースに肯定的であるため、フェアユースに当たると結論付けました。生成AIについて、「生涯で目にする中で最もトランスフォーマティブな技術の1つである」と判示しており、第1要素を重視して同判断に至ったことが窺えます。
(7)中央データベースの構築
上記のとおり、本判決は、本件書籍データを生成AIの訓練に使用する行為と、本件書籍データを使用して中央データベースを構築する行為を別個の使用行為と認定しているため、以下では、後者の使用についてのフェアユース該当性の判断について簡単に紹介します。
本判決は、本件書籍データを使用して中央データベースを構築する行為については、本件書籍データが①購入した書籍をデジタル化した書籍データである場合と、②海賊版サイトから無償でダウンロードしてきた書籍データである場合を区別して評価しています。
すなわち、①購入した書籍をデジタル化した書籍データである場合については、Yが当該書籍のデジタル化が完了した後に同書籍の紙の原本を破棄しており、また、デジタル化した書籍データを第三者に配布した事実も認められないという本件の事情の下では、紙媒体の書籍をデジタル化する行為は、複製ではなく単なるフォーマットの変更であり、フェアユースに該当するため、デジタル化した書籍データを保有することは著作権侵害に当たらないと判示しました。他方で、②海賊版サイトから無償でダウンロードしてきた書籍データである場合については、フェアユースに該当せず、Xらの著作権を侵害すると判示しました。
3. 本判決の特徴
本判決は、生成AIの訓練に著作物を使用する行為がフェアユースに該当することをはじめて認めた点で注目されます。一方で、本件書籍データを生成AIの訓練に使用する行為と本件書籍データを使用して中央データベースを構築する行為を分けて検討し、後者については、本件書籍データの入手方法を問題とし、海賊版サイトから入手した書籍についてはフェアユースを否定している点にも留意する必要があります。
なお、本判決後の審理では、Yが中央データベースを構築するために海賊版サイトから無償でダウンロードした数百万冊の書籍を使用した結果生じた損害についての判断がなされる予定でした。しかし、報道によれば、本年8月下旬、XらとYは、Yが海賊版サイトから取得した書籍のデータを破棄するとともに、Yが同書籍のうち一定の条件を満たす約50万冊の書籍について、1冊あたり3,000ドルを作者や出版社に支払うことで和解することに合意したとのことです。Yが支払う和解金の総額は15億ドル(約2,200億円)にのぼり、Xら代理人の発表によれば、米国の著作権侵害訴訟の和解金額としては過去最大規模になるようです3。
Ⅳ. Kadrey v. Meta Platforms, Inc.事件について
1. 事案の概要
Xら(13名の作家)は、YがXらの著作物を無断でダウンロードし、Yが開発したLLMの学習に利用したとして提訴しました。Yは、Xらが著作権を有する書籍少なくとも666冊をダウンロードのうえ、LLMの学習用データセットに組み入れていました。
Xらは、Yの利用はフェアユースに該当しないと主張して部分的略式判決を申し立てたのに対し、Yはフェアユースに該当するとして反対申立てを行いました。裁判所は、Xらの部分的略式判決申立てを棄却し、Yの反対申立てを認容しました。
2. 本判決の判断
(1)第1要素:使用の目的及び性格
Xらの書籍の目的は、娯楽や教育のために読まれることであり、Yが著作物をコピーした目的は、自社のLLMの訓練に用いることであると認定し、LLMを開発するために書籍をコピーするという行為は、新たな目的かつ異なる性格を持っており、極めてトランスフォーマティブであると判示しました。
また、YのLLMは最終的には商業的な目的で開発されたものであるとしつつ、商業性はフェアユースの第1要素を決定づけるものではなく、使用が高度にトランスフォーマティブである場合には、その重要性は相対的に低くなる傾向があるとして、本件においても、Yが原告らの著作物を使って製品を開発することで得られる利益は、第1要素において原告側に有利に働く決定的な要因ではないと判示しました。
(2)第2要素:著作物の性質
原告の著作物は、主に小説、回想録、戯曲などであり、著作権法が価値を認め、保護しようとする表現性の高い作品であるため、第2要素は原告側に有利に働くと判示しました。もっとも、第2要素がフェアユース分析全体に与える影響は大きくないとも判示しました。
(3)第3要素:著作物全体との関係における使用部分の量及び実質性
「検討すべきは、コピーした著作権素材の量ではなく、『公衆に提供された著作権素材の量』である」とする裁判例を参照し、YのLLMはトレーニングデータを出力しないような学習が実施されており、原告の書籍の意味のある量を出力しないため、本件においては使用量自体がそれほど重要な意味を持たないと判示しました。また、LLMは高品質な素材をより多く使用するほど性能が上がるという特性を持つため、Yが著作物の全文を使用したことは、合理的に必要であったといえると判示しました。
(4)第4要素:著作物の潜在的市場や価値への影響
Xらは、Yによるコピー行為が原告らの作品の市場に与える影響として、①YのLLMはXらの書籍から短い抜粋を再生産することができる、②YがXらの作品を無断で訓練に使用したことで、Xらが自らの作品をLLMの訓練の目的でライセンスする能力が損なわれたと主張しましたが、①については、YのLLMは、原告の書籍から意味のある量のテキストを生成することはできないとして否定し、②については、AI訓練のための著作物使用のライセンス市場は、原告が法的に独占する権利を有するものではないとして否定しました。また、本件のような事案においては、AIモデルが元の著作物とジャンルやテーマが似た作品を生成し、それが間接的に原著作物と競合し代替する結果となるという市場希釈の概念が非常に重要であるとしつつも、本件においては、訴状にも原告の略式判決申立書にも一切言及されていないとし、結論として、第4要素はYに有利に働くと判示しました。
(5)結論
本件において、YによるXらの作品の利用は高度にトランスフォーマティブであるため、Xは第4要素で決定的に勝つ必要があったところ、本件の証拠関係からは、第4要素はYに有利に働くため、Yがフェアユースの抗弁に関し、略式判決を得る権利があると判示しました。
3. 本判決の特徴
本判決は、Yのフェアユースに関する反対申立てを認容しつつも、その影響は限定的であると明確に位置づけています。本判決の前文においては、LLMを訓練するために著作権で保護された作品を許諾なく複製・利用する行為は、多くの状況で違法となり得るとの一般的な理解が示されています。
本判決では、第4要素がフェアユースの判断においては最も重要な要素であり、特にAI生成物による市場希釈について十分な立証がなされた場合、原告が第4要素で決定的に優位となり、その帰結としてフェアユース全体でも勝訴し得ることが示唆されています。
Ⅴ. おわりに
本稿で取り扱った2事件は、生成AIの訓練に著作物を用いる行為がフェアユースに該当し得ることの判断を示した点に意義があります。しかし、両判決は地方裁判所の判決であり、米国法における統一的見解が示されたわけではありません。また、生成AIではありませんが、例えば、上記のThomson Reuters事件では、AI 法的情報検索エンジンの訓練における著作物の使用についてフェアユースが否定されています。米国では、現在も生成AIと著作権を巡る訴訟が多数係属しており、今後も裁判例の蓄積が進むことが見込まれます。個別具体的な事案によって判断も異なり得るところですので、引き続き注視していくことが重要です。
- 読売新聞社、「記事無断利用」生成AI企業を提訴…日本の大手報道機関で初 : 読売新聞、日経・朝日、米AI検索パープレキシティを提訴 著作権侵害で - 日本経済新聞
- Thomson Reuters v. Ross Intelligence(2025年2月11日、デラウェア州連邦地方裁判所)。同事件は、AI法的情報検索サービスを提供する原告が、競合他社である被告を相手方として、被告がAI法的情報検索エンジンの訓練に第三者から購入したBulk Memos(弁護士の作成した「法的質問とその良い回答・悪い回答」をまとめたもの)を使用したことが、原告の著作権を有する著作物(Headnote)の複製に当たり、原告の著作権を侵害するとして、提訴した事件である。同事件でも、フェアユースが重要な争点の一つとなっていたが、同事件の事案ではフェアユースが否定されている。
- 生成AI学習に「著書を無断利用」と訴えられた米新興企業、2200億円支払い和解…著作権侵害で最大額か : 読売新聞