データ駆動時代における知財法の課題についてまとめてみた

2017/1/31の第16回JIPA知財シンポジウムに参加する機会があり、WIPO局長のガリさんや特許庁長官の小宮さんのような偉い人たちが、データ駆動時代を迎えるにあたって現行の知財法を見直す必要がある、みたいなことをしきりにおっしゃっていたので、論点をざっくりとまとめてみました。

現状の自分の理解にすぎないので、こいつおかしいこと言ってるなと思われた方は是非ご指摘を…

東京国際フォーラムで行われました。アリーナ、2階席、3階席まであってすごい。

まず、データ駆動で世の中を良くしていこうとしたとき、学習用データや学習済みモデルは流通させるべきというのが前提としてあるかと思います。

学習用データを流通させるべき理由は、データを持っていないIT企業は、学習用データが流通することではじめて学習済みモデルを生成できるからで、

学習済みモデルを流通させるべき理由は、学習済みモデルが流通すれば、学習済みモデルを生成するために必要な計算資源や計算時間を節約することができる上、再学習によって学習済みモデルをより発展させることができるから、だとざっくり理解してます。

しかし、学習用データや学習済みモデルが流通すると、どこまで自由につかっていいのかというのが問題になります。

学習用データに営業秘密が含まれている場合や著作権がある場合は、学習用データは保護されてしかるべきですし、学習済みモデルを作るのにはアルゴリズムや資源が必要ですから、投資によって得られた学習済みモデルに無制限にフリーライドされてしまうのは問題です。

データそのものは技術的思想とはいえないので特許法の保護のScope外ですので、不正競争防止法や著作権法で学習用データの保護を図ることが考えられます。

学習済みモデルについては、不正競争防止法、著作権法だけでなく、特許法による保護も考えられるでしょう。

しかし、現状の法律では学習用データや学習用モデルを適切に保護できないため、どのような法改正をしてこれらの保護を図るかを偉い人が最前線で議論し始めているわけです。理由はざっくり以下のように理解しています。

学習用データが現行法では適切に保護できない理由

学習用データが不正競争防止法における営業秘密に該当する形(NDA)で流通した場合、その学習用データにより生まれる学習済みモデルや、その学習済みモデルから生まれるアウトプットにも、学習用データの営業秘密性が適用され得るか否かが現行法では不明確なため、紛争が生じたときの法的な解決策がない。

学習用データに著作権がある場合があるが、その学習用データにより生まれる学習済みモデルや、その学習済みモデルから生まれるアウトプットに、学習用データに対する依拠性が認めれれるか不明確であるため、著作権侵害が成立するかどうかも不明確となり、紛争が生じたときの法的な解決策がない。

学習済みモデルが現行法では適切に保護できない理由

学習済みモデルを模倣する手法が存在するが、その模倣品のネットワーク構造やパラメータ等の使用はオリジナルと全く異なることが多いという事情から、学習済みモデルについて特許権を取得しても、イ号が特許権の技術的範囲に属さない可能性が高い。

学習済みモデルをDistillationのようなリバースエンジニアリングに類する手法で模倣した場合、営業秘密の1要件である非公知性を満たさないため、不正競争防止法による保護が図れない。

上記の通り、著作権侵害の要件である依拠性が不明確であるため、紛争が生じたときの法的な解決策がない。

総括としては、特許権による保護は望み薄な気がするので、うまく学習用データや学習済みモデルが流通してみんなが得するようなエコシステムを作って、そのエコシステムを前提に、フリーライドの抜け穴を埋めるように不正競争防止法と著作権法の改正を考えていくという感じなのでしょうか?

というところでどうでしょう。

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.