AIと人間の共創

Hinako Makita
SFC Media Art 2022
Published in
Dec 22, 2022

Text-to-ImageのAIモデルが急激に進化し,日の目を浴びた2022年. Stable DiffusionやMidjourneyなどの画像生成AIモデルが大衆に開かれた形で登場し,文章(プロンプト)から高精度な画像を生成する技術を誰もが利用可能になった. 人間の表現・創作活動をAI技術が模倣できるようになった今,その意義や危険性はどこにあるのか. 特に, AIによる画像生成技術が人の創造性やアートに与える影響について具体的に論じることとする.

AIによる創作活動模倣の意義

AIによる模倣が不自然なく, 高精度で可能になった今, その意義は「人間の創造行為」とは何か, もっとも「人間」とは何かを定義・熟考させることにあるだろう. 人型ロボットのアンドロイドは, 人間を人工的に模倣・再現する試みであり, そこには常に「人間らしさ」とは何かという深遠な問いが存在している. 模倣を試みることで, 人間がいかに複雑な動作を無意識的におこなっているか, さらに, どの要素が生命的であると感じさせているのか, を明らかにできる. これはある種, 人工的に作ることで理解する, 構成論的アプローチであると言えるだろう. アンドロイドという人間の行為を模倣する非人間の第三者を介在させることで, その比較からむしろ「人間らしさ」が浮かび上がってくるのだ. AIによる創作活動の模倣も同様に, 人間的非人間の介在から, 「人間の創造行為」とは何かを際立たせるのではないか.

また, 人間がどのように世界を認識し, 何を見ているか, 環世界(種特有の知覚世界) を再定義するには, 異種生命との対比, 非生命でありながら人間の模倣をするAIとの対比が極めて重要だと考えた.

AIによる創作活動模倣の危険性

AIによる模倣の危険性は, AIモデルの制作者があらかじめ意識的/無意識的に規定する表現の制約に表れることだろう. 特に危険性が大きい事象は, AIの学習に使われる数多のデータに偏りが大きいことだ.ここでは,AIによる画像生成技術に焦点を当てて論じる.ジェンダーを切り口にした例を挙げると, 女性(的外見)の建築家や男性(的外見)の看護師などの,少数派カテゴリの人々は,AIによって画像生成されにくい.「建築家」とプロンプトを打つと,男性建築家のみが,「看護師」では女性看護師のみが生成される場合がほとんどだ.統計的に1割程度存在するにも関わらずAIに画像生成をさせると実世界の統計以下の分布,もしくは存在しないものとして扱われることは,人々のアンコンシャスバイアスを助長する可能性を孕む.

ここからは,実際にわたしがStable Diffusionを用いて模倣した,歴史的芸術作品「ミロのヴィーナス」について,そこに潜む危険性の洞察を行う.ミロのヴィーナス Vénus de Miloは古代ギリシアで創られた裸婦像で,発見当時から両腕が欠けている.

Vénus de Milo

「ミロのヴィーナス」との固有名詞を使わないプロンプトから,これを模倣することを試みた.結果, ‘armless’ との言葉を入れても腕はなくならず,’woman’ と記述しても男性器のようなものが表出する場合が多数との結果となった.

prompt “Ancient Greek sculpture of armless woman wearing skirt”

’armless’ と表記しても腕はなくならないが,指先は消える例は散見された.

prompt “Ancient Greek sculpture of armless Aphrodite in Louvre Museum”

かなりの確率で,両性の身体特徴が見られる像が生成された.

この結果を踏まえて考察してみる.古代ギリシアの人間彫刻は,ほとんどが両腕とも有していて,また多くのモチーフが裸体男性である.これらの統計的偏りが学習データに顕著に現れており,表現の制約が,AIモデル制作者の無意識的に(意図せず)存在している可能性がある.また,裸体や生殖器などの性的なモチーフに関して,意識的に制約をかけているとも考えられるだろう.

表現制約の危険性は,一見そこに制約があると気づかない点だろう.AIは時折,全知全能の先端技術で問答無用に信用できると人々によって勘違いされることがある.「AIを使った」画像生成技術という響きは,いかにも未来的で今まで不可能だったことを全て可能に変えるものだと誤認し得る.例に挙げた,「腕が欠けた彫刻」などの生成できない表現があることを忘れてはならない.でなければ,ある種の芸術表現はいずれ忘れ去られ,死に向かうこととなるかもしれない.

AI画像生成技術が人間の創造性やアートに与える影響

Text-to-ImageのAIモデルの特徴として,素早く大量に密度の高い絵が生成できることがある.完成までに相応した時間を要する従来の緻密な絵画やコンピュータ上のグラフィックとは一線を画したAI画像生成技術は,人間がブリコラージュ的発想で絵をつくることを可能にしたのではないか.

“spiral stairs”で生成した画像を加工して組み合わせたもの

1つのプロンプトから複数枚の異なる画像を生成できることから,それらをコラージュ的に繋ぎ合わせてより複雑で大きい構造物をつくることを試みた.存在しなかった絵を新たに生み出し,それらを使ってさらに新しい視覚表現を生み出す.この点においてStable Diffusionは人間の創作活動を助けるパートナーとなりうる.

Photoshopで後加工し,画像ごとの境界線をぼかしたもの

さらにStable Diffusionは,いずれ「油絵」や「水彩画」のように,一つのアート技法として洗練されてゆくのかもしれない.油絵で筆づかいや色を学ぶように,どのようなプロンプトで美しい画像を生成できるかについて,経験から学び,訓練されたProfessional Stable Diffusioner が現れると妄想できる.同じ絵画の作品の中でも,油絵と水彩画で画風が異なるように,Stable Diffusionにもある種固有の画風や色彩感覚があるように感じられる.多岐にわたる画像をなんでも生成できる機能を持ちながら,固有のらしさを持つこのAIモデルは,一つの技法として成立する未来があるかもしれない.

Written by Hinako Makita

--

--