12月画像生成AIハッカソン 上原

こんにちは!3年の上原です。

12月のハッカソンは、AIを使った画像生成でした。

テーマ

「画像生成系AIを用いて、古橋研究室らしい地図や空間情報、キャンプなど関連するグラレコ素材的イラストを一人10作品つくる(プロンプトを含む)」

作成ツール

  • ChatGPT-4
  • Midjourney

私は、古橋研究室らしいイラストということで、①キャンプ、BBQ、ツリーハウス系、②マッピング系、③ドローン系

①キャンプ、BBQ、ツリーハウス系

“A vibrant camping scene inside a tent, featuring a clean-cut, slightly chubby Japanese male teacher in his late 40s with short, well-groomed spiked hair, wearing glasses and a scarf. He is surrounded by seven Japanese university students, all engaged in a BBQ. The group includes five male and two female students with long hair. The atmosphere inside the tent is energetic and filled with laughter, with the students enjoying the BBQ and interacting with each other. The tent is brightly lit, creating a cheerful and welcoming environment for the camping experience.” by ChatGPT-4
Vibrant, Camping, Tent, Clean-cut, slightly chubby, Japanese male teacher, Late 40s, Short hair, Well-groomed, Spiked hair ,Glasses, Scarf, Seven, Japanese university students ,BBQ, Five male students, Two female students, Long hair, Energetic, Laughter, Interaction, Brightly lit, Cheerful, Welcoming, Environment” by Midjourney

古橋先生の特徴である、眼鏡とスカーフを入れ込むこと、楽しさや歓迎ムードが伝わるような明るい雰囲気に落とし込むことについてこだわりました。

また、同じプロンプトで、ChatGPT-4とMidjourneyでどのように生成されるか比較してみました。そちらが以下2つの画像です。

ChatGPT-4作
Midjourney作

プロンプト:Glasses , Scarf, around 40s, Short hair, Clean-shaven, Male teacher, six students, Harmonious, Japanese, a standard Tree house, Nature, Forest, BBQ, Cutting a tree, Outdoor, Welcome

どちらも古橋研究室らしくキャンプやBBQをしているのですが、よりツリーハウス感が出たのはChatGPT-4だったかなと思います。

②マッピング系

“パソコン、デジタル地図作成、オープンデータ、グローバル、眼鏡でスカーフを巻いた40代くらいの短髪の髭ナシの男性の先生、学生6人、災害時、リモートワーク、研究室、和気藹々、日本人” byChatGPT4
A harmonious scene in a Japanese research laboratory, where a clean-shaven, 40-something short-haired Japanese male teacher with glasses and a scarf, along with six Japanese students, is working on digital map creation using open data for global disaster response. The environment is set for remote work during a disaster, with the group focused on their computers. The lab has digital mapping tools and displays. The teacher and students are cheerfully collaborating, sharing ideas and strategies. The mood is warm and cooperative, emphasizing the teamwork and community spirit among the Japanese teacher and students as they engage in their task. by Midjourney
“Computer ,Digital map creation ,Open data , Global , Glasses , Scarf , Around 40s ,Short hair, Clean-shaven, Male teacher, Six students, During disaster , Remote work, Research laboratory, Harmonious, Japanese” by Midjourney
40代の清潔感のある短髪で眼鏡とスカーフを着けた日本人男性教師が、グローバルカンファレンスでプレゼンテーションを行っているシーン。彼は伊能忠敬のように日本人全員が地図を使いこなせるようになることを目標にしています。教師は、地図の革新的な使い方、オープンデータの重要性を示した大きなスクリーンの前に立っています。様々な分野の専門家からなる聴衆は、プレゼンテーションに没頭し、楽しんでいます。雰囲気は楽しく、かつ学術的で、教師はその主題に関する専門知識を熱心に共有しています。カンファレンスルームは、このようなグローバルなイベントにふさわしい現代的で設備の整ったものです。by ChatGPT-4
A scene of a clean-shaven, short-haired Japanese male teacher in his 40s, wearing glasses and a scarf, presenting at a global conference. His goal is to make every Japanese person as proficient with maps as Ino Tadataka. The teacher stands in front of a large screen, showcasing innovative uses of maps and the importance of open data. The audience, consisting of professionals from various fields, is deeply engaged and enjoying the presentation. The atmosphere is both enjoyable and academic, with the teacher passionately sharing his expertise on the topic. The conference room is modern and well-equipped, suitable for such a global event.” by Midjourney

マッピングについての画像生成では、世界中のどのような人でも携われることを重要視しました。しかし、あまりうまく反映してくれなかったので、どのような単語を含めれば良かったのかアイディア募集中です。

③ドローン系

drone, outdoor, fieldwork, Glasses , Scarf , Around 40s ,Short hair, Clean-shaven, Male teacher, Six students, Harmonious, Japanese, 6 students, community, crisis, disastar” by ChatGPT4
drone, outdoor, fieldwork, Glasses , Scarf , Around 40s ,Short hair, Clean-shaven, Male teacher, Six students, Harmonious, Japanese, 6 students, community, crisis, disastar” by Midjourney

ドローンやフィールドワークをテーマにした場合は、ChatGPT-4とMidjourneyで重要視する要素が違うのかなと思いました。ChatGPT-4は田舎要素(プロンプトには入れていない)が強く、Midjourneyは災害時の活動という要素が強そうに思えました。

まとめ

今まで課金のハードルが高く、生成系AIを使ったことがありませんでしたが、いざ実際に使ってみるとその精度の高さに驚かされました。

また、今回生成した画像では、わざとプロンプトを少しずつ変えてみました。その結果、ChatGPT-4もMidjourneyも、英単語を区切る方法が最も自分のイメージに近いものが出来上がるのではないかなと思いました。少なくとも、日本語で打った場合に比べて、英語の方が精度が高かった気がします。そして、単語もランダムに並べればよいわけではなく、関連するものを近くに置いたり、場面設定を最初に持って来たりすると反映されやすかったです。

グラレコ

--

--