著作権の侵害?AIの学習データに著作物を利用しても問題ない?

雑記
ペイ
ペイ

AIの学習データ と 著作権について考察してみます。

これから深層学習や画像処理をされる方に参考にしてもらえると嬉しいです。
かなり、かいつまんだ説明となっていますが、要点はしっかり押さえているはずです。
(著作権ってかなりナイーブな話題なので、細心の注意をもって調べたつもりです。解釈が間違っていたりしたらご指摘ください・・・)

著作権について調べた目的

GAN(敵対的生成ネットワーク)で画像を生成する場合、基本的に大量の学習データが必要となります。

簡単に、GANで画像生成をするイメージはこんな感じ。

学習データに著作権物が含まれていたら・・・?
著作権の侵害で訴えられる・・・?
気になったので調べてみました。

結論!基本的に、著作物を学習データに使用するのは問題ない。

まずは結論から。
私の調べた範囲では、GAN(敵対的生成ネットワーク)の学習データに著作物を利用するのは、基本的に問題はありません
また、これは営利・非営利を問わず適用されます。
理由を解説していきます。

なぜ著作権の侵害にならないか?

そもそも著作物とは?

著作物は、”思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するもの”(著作権法 第2条1項1号)と定義されています。

ペイ
ペイ

簡単にいうと、著作物とは自分の考え(思想)とか気持ち(感情)を作品として表現したものです。そこに価値があります。
ただのコピーしたものや、事実に基づくデータは著作物じゃないってことですね。

著作物の例としては下記。

著作権法 第10条 著作物の例示
一 小説、脚本、論文、講演その他の言語の著作物
二 音楽の著作物
三 舞踊又は無言劇の著作物
四 絵画、版画、彫刻その他の美術の著作物
五 建築の著作物
六 地図又は学術的な性質を有する図面、図表、模型その他の図形の著作物
七 映画の著作物
八 写真の著作物
九 プログラムの著作物

出典:e-GOV法令検索 著作権法(https://elaws.e-gov.go.jp/document?lawid=345AC0000000048)
ペイ
ペイ

だいたい想像通りですかね。

著作権の侵害とは?

では、”著作権の侵害”となるのはどういった時なのでしょうか?

全部載せると多いので、、一部抜粋します。(著21条~28条より)
著作者は下記のような権利を著作者に専有させています。
つまり、著作者以外の人が、下記の行為をすると著作権の侵害にあたります。

著作権に含まれる権利の種類
・著作物を複製する権利(著作権法 第21条)
・著作物の公衆送信を行う権利(著作権法 23条1項)
・著作物を翻訳し、編曲し、若しくは変形し、又は脚色し、映画化し、その他翻案する権利(著作権法 28条)

出典:e-GOV法令検索 著作権法(https://elaws.e-gov.go.jp/document?lawid=345AC0000000048)
ペイ
ペイ

僕たちがやろうとしているGANでフリー素材生成って・・・
① 複製(Webからコピーして収集)

② 変形(GANで学習データを元に画像生成)
③ 公衆送信(フリー素材として配布)
思いっきり著作権を侵害しているっぽく見えますよね。

遅くなりましたが、、ここからが本題!!笑
著作物を無断でAI(今回は特にGAN)の学習データとして用いた場合、なぜ著作権の侵害にならないのか?
こちらの理由について掘り下げていきます。

著作権法 第30条の4 思想・感情の非享受利用

著作権法には著作者に上記のような権利を与える一方で、『著作権の制限』も記載されています。
→ つまり、なんでもかんでも著作者の権利ではないぞ!ということ。

簡単な例で言うと、下記のような例では著作者の許諾を得ることなく著作物を利用できます。
・『私的使用』(著作権 第30条)
・『教科書等への掲載』(著作権 第33条)
・『引用』(著作権 第32条)

その『著作権の制限』の中で、著作物をAIの学習データに使ってもOKと言える理由がこれ!!

著作権法 第三十条の四
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合

出典:e-GOV法令検索 著作権法(https://elaws.e-gov.go.jp/document?lawid=345AC0000000048)

注目してほしいのは、二 情報解析用 には著作物を利用できる!ということ。
(ただし、著作権者の利益を不当に害しない範囲でね!)

ペイ
ペイ

そもそも著作物の価値は、著作物に表現された 思想や感情を享受することで生まれるという前提があります。
なので、思想や感情の享受を目的としない著作物の利用(情報解析とか)は、OKということを書いているのがこの著作権法 第30条の四です。

例外もある!こんなときは著作権法の侵害になるかも?

さて、ここまで、「AIの学習データに著作物を利用し手も問題ない」という点について正当性を主張してきましたが、例外もあるようです。

著作権の侵害になりうるのが、「学習データと類似のデータをAIが生成してしまった場合」です。
この場合、著作権の侵害になるかどうかの争点になるのは、「著作物との類似性」と「依拠性」です。両方が認められた時に著作権の侵害と判断されます。

※依拠性・・・他人の著作物の内容を知って、その著作物の内容に基づいて著作物を作出しているかどうか。

著作物と類似の画像がGANで生成された場合、当然、学習データを利用しているわけですから「依拠性あり」と判断される場合がほとんどのようです。

ペイ
ペイ

生成されたデータが学習データと類似していないか?はしっかりチェックする必要がありますね。
私たちも、ここは十分に注意を払ってチェックするようにしたいと思います。
少々面倒ですが、人の目でチェック!これが一番確実でしょうね笑

まとめ

☑ AI(今回はGAN)の学習データとして著作物を利用するのは、情報解析にあたるため、著作権の侵害にはならない。
 → 著作権法 第30条の4が適応される。
☑ GANで生成された画像データが学習データと類似している場合、著作権の侵害となりうるため、注意が必要。
 → 「著作物との類似性」と「依拠性」が認められると著作権の侵害となりうる。

ペイ
ペイ

というわけで、著作権の侵害にならないよう、細心の注意を払って素材を生成してまいります。
また、これから(AIを使って)なにか創作活動を始められる方も上記内容には十分注意してくださいね!参考になればうれしいです。

コメント

タイトルとURLをコピーしました