Azure OpenAI Serviceでアプリを作りたいエンジニアやプロジェクトメンバーの非技術者にもオススメ

本書について

マイクロソフト社の精鋭エンジニアたち(永田祥平,伊藤駿汰,宮田大士,立脇裕太,花ケ﨑伸祐,蒲生弘郷,吉田真吾(敬称略))がホットなテーマOpenAIについて、ドーナツ本を出版してくれました。

以下、目次。

第1部 Microsoft AzureでのChatGPT活用

第1章 生成AIとChatGPT

第2章 プロンプトエンジニアリング

第3章 Azure OpenAI Service

第2部 RAGによる社内文章検索の実装

第4章 RAGの概要と設計

第5章 RAGの実装と評価

第3部 Copilot stackによるLLMアプリケーションの実装

第6章 AIオーケストレーション

第7章 基盤モデルとAIインフラストラクチャ

第8章 Copilotフロントエンド

第4部 ガバナンスと責任あるAI

第9章 ガバナンス

第10章 責任あるAI

直前のアナウンスで恐縮ですが、1/22(Mon)に出版イベントもあります。著者たちに触れる良い機会ですので、ぜひご参加ください。

著者の一人立脇裕太氏とは元同僚というご縁があり、ご献本いただきました。ちょうど読みたいと思っていましたが、この機会がなければ、この短期間で読み切って、書評としてアウトプットすることは絶対にできませんでした。

この場を借りて、この機会に心よりお礼申し上げます。そして、ご出版おめでとうございます。

書評のサマリ

一言で良書。

章立ても書きぶりもわかりやすい。カバーする内容も、概念の理解からAzureによる実装、AI倫理まで幅広い。Azure OpenAI Serviceでアプリを開発する全ての関係者に、ぜひオススメしたい。生成AIは今後マルチモーダル(文字も画像も)対応と言われているが、その基礎知識としても有効そうである。
評者は冬休み中、飛行機の中(太平洋上空)で本書を読んだ。眠気も吹き飛び、機内のエンタメより楽しめた。

評者の自己紹介

評者がMedium初投稿ということと、書評のバイアスになり得るので、簡単に自己紹介。詳細は、Linkedinをご覧いただきたい。

外資系AIスタートアップDataRobotの金融業界担当データサイエンティストで、Google Cloud Associate Cloud Engineerの有資格者。業務では生成AIも扱っている。自分のことをエンジニアとは思っていないが、エンジニアスキルに興味はある。実態は、技術系のおしゃべりおじさん。

二児の父で、可処分時間はほとんどないが、冬休みと友情パワーと家族の理解で本書評を書いた。この書評を公開した後は、妻の愚痴を黙って聞き、子どものおもちゃになっている予定。

書評の概要

本書評の狙いは、生成AI関連の書籍が膨大に出版される中、本書をざっとまとめ、本書と想定読者のミスマッチを減らすことである。必要な前提知識を整理し、どんな立場の人が本書のどこを読むべきか、ガイドラインを作り、効率的な読書にも役立てたい。

本書の構成と読書のガイドラインは、図0.1でまとめられている。

図0.1

この図の検証と必要なスキルを整理するのが評者の重要な役割である。
評者の検証結果として、この図は正しく、レベル感とゴール感に整合性が認められる。スキルについては、書評の本編で述べる。

次に、この図と読者層を整理した。

図0.1に評者加筆

本書はエンジニアが主にエンジニア向けに書いている一方で、生成AIのプロジェクトは、様々な立場の利害関係者が登場する。そのため、関係者の共通知識として、本書を読むことを推奨したい。

立場が違えば関心も違い、専門書は網羅的に読む必要がないという前提で、誰がどこを重点的に読むべきか、ある程度目星をつけられるようにした。本書の使い道として、技術者が非技術者に教える用のネタ本にしたり、非技術者が生成AIプロジェクトで技術者と共通言語を喋れるためにも使えるだろう。

例えば、『経営層の皆さんは、第一部と10章を読んでください』といった伝え方もできる。せっかくの機会として、一緒に1時間程度の勉強会や読書会を社内で開催するのが良いだろう。こんな楽しい本を読みあった体験は、決して侮れないものだ。

本書に書かれていないこと

もし、この節に書かれているような内容を本書に期待するのであれば、他書を探した方が良い。

・生成AIの理論的な理解を深めたい。

→付録Bに、実務家向けに書いてある程度である。代わりに論文を読もう。

・生成AIの実践的なノウハウを習得したい。

→本書はAzureの使い方を主眼としているため、いわゆる例題で実践的なことはあまり書かれていない。そもそも、2024年1月現在で、まだ世の中にベストプラクティスが十分蓄積されていないのではないか?

・OpenAI以外のLLMも使いこなしたい。

→7.3節に比較的あっさりと書いてある。本書に書かれているように、2024年1月現在で、特殊な要件でない限り、OpenAIをベースに進めるのが無難そうではある。最初からトリッキーな要件は、リスクが高すぎる。

書評の本編

本節は、立ち読み代わりに、本書をダイジェストにまとめたものである。

初級編の第1部では、『生成AIとChatGPTとは』といった入門編、Azure OpenAIの使い方、シンプルなチャットアプリをGUIで開発する方法がまとめられている。

成果物として、図3.28のようなチャットボットを開発できる。素のOpenAIで、RAGなし(第2部中級編で扱う)、コーディング不要のため、プロジェクト関係者一同で手を動かしてみるのに最適なパートである。

図3.28

クラウドサービスの知識があると、本節はとっつきやすくなる。技術者は、ここで非技術者のサポートをしよう。

このチャットアプリは、主に社内向け、学習目的で、障害が発生しても『学習目的なので』と開き直れるレベルである。無料で使えるChatGPTと、乱暴に言えば性能差はあまりないだろう。

中級編の第2部では、より高性能な社内向けチャットボットを開発する。Bing Chat(現Copilot)のように、RAGによって独自文書も参照できるようなアプリを開発する。図5.7のような成果物で、日本史の専門家のようにQAができる。このアプリはPOCレベル、社内向けであり、システム障害が起こっても謝れば許してもらえる要件を想定している。

図5.7

中級編は、4章でRAGの要素技術について説明し、5章でRAGアプリの実装と精度改善を試みている。Pythonやクラウドサービス及び多少の自然言語処理の知識を前提とし、技術者向けに書かれている。要素技術が網羅的に書かれているのは、生成AIプロジェクトの技術的な難しさの一面を示している。

第3部は上級編となり、POCを終え、本番運用レベルの複雑な要件に対応していく。生成AIアプリ開発のためのCopilot Stackの要素技術(図6.1)を学習する。ユーザの画面、その裏にあるエンジン、それを支えるインフラ、UXを改善するためのヒントまでまとめられている。かなり先進的なパートになり、今年1〜2年くらいは十分使えそうな印象を持った。ゴリゴリのエンジニアスキルが求められ、評者も追いつこうとしているところである。

図6.1

最後の第4部は、社内で生成AIアプリ開発が当たり前になった世界観を想定している。第9章では、開発を効率化するための共通基盤の要件(表9.2)と、Azureでの実現方法がまとめられている。2024年1月現在で、生成AIアプリの量産体制が必要な企業はそこまで多くないと思ったが。

表9.2

第10章では、マイクロソフト社のAI倫理がまとめられている。これをいい加減にすると、特に対Consumer向けのアプリはとんでもないリスクになりかねない。この章は、生成AIプロジェクトに関わるすべての人に熟読してほしい。こういったリスクが顕在して『生成AIまじでやばい』といった炎上騒ぎは、日本におけるAIの普及や技術者にとって悪夢でしかない。自動車を運転するには免許証が必要なように、生成AIをビジネスで扱うには最低限の倫理観やリテラシーが求められる。だから、みんなで第10章は読もう。そんなに長くない。

結びに

本書に対する指摘というよりは、そもそも書籍で学習する方法について述べたい。

今はUdemyやCourseraのようなビデオ型の学習教材も一般的になってきている。筆者の感覚と経験では、まずはビデオ型で学習する方が、時間が効率的に使えると思う。文字情報だけでなく、視覚情報や音声情報やインタラクティブ性もあるためだ。セール期間であれば、書籍を買うのと費用もあまり変わらないこともある。

ざっくりでもビデオ型の学習教材を経てから、本書でじっくり理解を深める方法を、評者は個人的におすすめしたい。

本書は向こう1–2年は十分使えると思っている。生成AI業界の変化は激しいため、この意見が正しいかどうかを1–2年後に検証するためにも、ここに記す。

--

--