【ラジオ】機械学習って何?

Yusuke Stephen Inoue
Academication
Published in
12 min readMar 9, 2017

人工知能ラヂオ書き起こし・エピソード2

<機械学習って何? ゲスト:早稲田大学大学院 井上雄介さん>

石井)はい、こんにちは。人工知能ラヂオ、第二回目も第一回目に引き続き井上雄介さんをお迎えして人工知能及び機械学習の話をさせていただきたいと思っています。私ホストの石井大輔です。井上さん引き続きよろしくお願いします。

井上)はい、早稲田大学大学院で機械学習の研究をしている井上です。よろしくお願いします。

石井)はい。では二回目ということで機械学習って何?というテーマです。まずは井上さんの言葉で、簡単にいうとどういうことなのか(お聞きしたい)。

井上)一言でいいますと、「データから自動的にルールや法則を学習すること」になります。もともと人工知能の始まりとして、人間がこういう状況の時にこのように行動するといったようなプログラミングを書き込むところから始まりまして。例えば、もし赤くて、もし丸くてだったらりんごになる(りんごと判断する)みたいにルールを書き入れるところから始まったんですね。それを書き込むというのが第一次ブームとかで行われたんですけども、やってみると人間の感覚とか知識というのはどう考えても世界を記述しきれるものではないということに気づいたんですね。そこで人間がルールを書き込んで、ルールに従って判断するというのを逆にしたのが機械学習で。機械学習は、既にあるもの、例えばりんごの画像をたくさん集めて、それから自動的にりんごというのは赤いという特徴があり、丸いという形の特徴があるというのを学習する。

石井)ディープラーニング(の場合)は自らりんごはりんごだと分かってしまう領域までいっている..といことですね?

井上)その違いなんですけど、、ディープラーニングまでいきますか(説明しますか)?

石井)あ、いえ。大丈夫です、後の話にしましょう。

井上)はい。ディープラーニングのすごいところは二つ〜三つほどあって、そのうちの一個が今の話に入っちゃうんですよね。

石井)なるほど。では三回目の録音の時にしましょうか。ディープラーニングの話はまとめて話すようにしましょう。では先ほど井上さんにまとめて頂いた、ここの部分ですね、いま図を書いて頂いたのですが、機械学習は三つのカテゴリーに分かれる、ということで。一番が教師あり学習。二番が教師なし学習。三番が強化学習というところで。一番の教師あり学習の中に分類という分野と回帰という問題があるということですね。

井上)はい。

石井)教師なしの方は主にクラスタリングということがメインじゃないかなと思うんですけど、この辺りからお話させていただければと思います。

井上)はい、そうですね。機械学習は、教師あり学習、教師なし学習、強化学習という三つに分かれまして。まず教師あり学習というのは、ある入力データに対してあるある答えが決まってあるようなものになりますね。

石井)なるほど。

井上)さっきのりんごの例ですと、りんごの画像という入力があって、出力としてこれはりんごである、と教えてあげるようなものになります。その際、みかんの画像が入力として入ってきた時は、出力として、これはみかんであると教えてあげるような。この答えの部分を”ラベル”と呼ぶんですけど、ラベルが付いた学習(というカテゴリー)になります。そしてみかんの画像やりんごの画像、またはブドウの画像などをたくさん入れていって、答えを教えていく。そうすると、AIの部分がそれぞれの特徴を学習して、学習した状態になった時にりんごの画像を入れると、りんごと自動的に帰ってくることになる。今説明したのが教師あり学習の中で、”分類”になります。このように、みかん、りんごなどを分ける作業を分類と呼びます。

石井)分類は、スパムメールフィルターも分類..?

井上)そうですね。スパムかそうではないかという簡単な分類になりますね。そちらもある程度こちらから答えを与えてあげて(分類を行なっている)。

石井)もう一個の分野が回帰ですね。私も勉強中なんですけども、例えば不動産価格の予想とか、中古車の価格予想。例えば、中古車100台のデータがあって、101台目の値段を車種とか購入年代、中古かそうでないかなどのデータから、幾らでしょうみたいな(値を求める)のって回帰になるんですかね?

井上)そうですね。回帰と分類の違いというのはすごく単純で、分類の場合は”カテゴリデータ”(みかん・りんご・ブドウなどを分ける作業)で、回帰というのは基本的には連続値でして。例えば不動産の価格ですと、何十万だったり何百万だったりというような”数値”になります。

石井)なるほど。

井上)実際、違いというのはそれくらいで。入力にしては分類にしても回帰にしても、ある程度なにかしらのデータが入ってきて、機械を通した時に答えを教えてあげることによって(成り立っている)。分類の場合、みかんの画像を与えた時に、これはみかんですよと(教えてあげる)。回帰の場合、この条件の時に不動産はこのくらいの金額にするのだということを答えとして教えてあげて、それを繰り返す。そうすることによって、回帰の場合、幾らか決まっていない未知のデータが入ってきた時に、この条件だったらこのくらいの値段であるというように判断できます。なので回帰と分類は本質的には似たようなものだと考えてもらっても構わないかと。

石井)そうなんですね。回帰の場合はグラフとか使ったりして表すってことになるんですかね。私も今スタンフォード大学のビデオシリーズで勉強していて、一番単純な線形回帰とかだと、一次式ですよね。斜めの線の延長に予想しようとした値があるといったような(イメージ)。それが二次関数だったり三次関数だったり、三次元だったらお椀型のグラフになったりということで。

井上)そうですね。回帰はそのような連続値を予測するので。実は回帰でも分類はできてしまって。回帰で、仮に100以上だったら何々というように(ラベリング出来る)。なので、分類は回帰よりも解像度が荒いものと考えてもらっても良いかもしれません。

石井)そうなんですね。

井上)はい。本質的にはやっていることは同じです。

石井)わかりました。..教師ありは具体的で割と分かり易いのですが、教師なしの方はイメージが掴みにくい方も多いのではないかと思っていて、これは言葉で言うとクラスタリングという分野になるんですかね。構造を抽出するといったような。

井上)例が難しいのですが、教師なし学習というのは教師あり学習と違って、データだけが与えられていてそのデータに対する答えがないような状態になりますね。みかん・りんご・ブドウの分類を先ほど挙げましたが、教師なし学習の場合、どれがみかんで、どれがりんごでという答えがないので。データの間の近さ、似ている度などから自動的にクラスタリングするようなものになります。

石井)簡単にいうと、例えば果物の写真がノーヒントで100枚並んでいます。これをグループ分けして下さい、というような感じですよね?

井上)そうですね。

石井)その中にブドウがあったりバナナがあったりオレンジがあったりすると(いったような話ですよね)。

井上)はい、そうですね。りんごだったら赤色なので、赤色同士の写真だと近いだろうということでりんごのグループ。もしくはブドウだったら、丸がたくさんあって、かつ緑色だからブドウ同士の画像が近くにいくような感じです。ただ、答えは与えられてないので、機械が自動的にやって、それがブドウの集まりであるとか、りんごの集まりであるなどを判断する部分は結局人間(の作業が必要)になります。したがって、教師なし学習は解析の一番はじめにやることが多いです。

石井)はい。「グラフ上で◯と×がランダムに並んでいて、それをグループ分けして下さい」みたいなものを、私もチャレンジしたことがあるんですけど、今の果物みたいな例の場合、色を数字にしたり、形を数字にしたりなど、結局(情報を)数値化するんですかね?..でも形とかは数字にできないですよね?

井上)丸だったりとかを一つの変数として特徴とすることもできますし、画像であるのであればそのまま画像を数値に変換して..

石井)そっか。画像ごとのピクセルごとに数値になっているということですもんね。

井上)そうです。画素数だったりもあるので、それで判断するような感じです。今すごくその辺りは進んでいて、画像の方ではかなりの精度が出るようになっています。..あとは強化学習ですか?

石井)そうですね。強化学習。これはみんな知りたい分野だと思っていて、ニュースなどでもセンセーショナルに書かれることが多い。囲碁や将棋の分野だったり、私の見たビデオですと、スーパーマリオブラザースをコンピュータが操作してどんどんクリアしていくみたいな。要するに段々と勝手に頭が良くなるみたいなものが強化学習..なんですよね?

井上)そうですね。強化学習はトライアンドエラーを繰り返して良くなっていく、というようなイメージです。教師あり学習と教師なし学習と何が違うかと言いますと、強化学習というのは、機械がある状態(エージェントと呼ぶのですが)にいて、それを認識してどういう行動をとるかという幾つか選択肢があり、ある行動をした時に報酬もしくは罰則を与えるようなことする。..また次行動して報酬か罰則を与える、というようなことを繰り返していく(というような仕組みです)。最終的に一番報酬が多かったところが正解(最善ルート)というような感じになります。

石井)はい。

井上)教師ありの場合と何が違うかと言いますと、強化学習の場合は報酬(ある一場面で切り取ったところの報酬)というのが正解とは限らないということです。

石井)なるほど。

井上)その場では、正解かもしれないということで報酬を与えているのですが、マリオの例でいくと結局マリオが死んじゃったりしたら、そこ(の報酬判断)は違ったのかもしれない。答え見込みということで報酬を与えているので、それらの一連の動き(報酬判断)があっていたかどうか判断するのは、最後までいった時になります。だから、強化学習は一見悪手のような手をとったりもします。

石井)..意思決定のロジック、マリオの例の場合どう操作するかみたいなことがロジックで決まっていくと思うんですけど、そのロジックの精度が自動で良くなる。ご褒美を与えられること、もしくは罰せられることによって、意思決定のロジックそのものが変化していくんですよね、きっと。

井上)そうですね。行動も変わっていくし、もしくはかなりランダムで。試行錯誤してこういう行動をしたおかげで上手くあの場所を飛び越えられた..というようなことを学習して。一回学習してしまえばもうそこは飛び越えられるので、その次に進んでいくような感じですね。

石井)なるほど。なかなか奥が深いですよね。

井上)そうですね。強化学習というのはトライアンドエラーなので、ある意味一番学習している感はありますよね。笑

石井)そうですよね。おそらく今 人工知能分野でもっとも一般の人が注目していることってそこじゃないかな..と思いますね。囲碁とか将棋の場合もルールが決まっているので、最終的には勝つとか負けるだとか。将棋の場合ですと、王手をかけるとポイントが+10ポイントで、飛車とか角を取られると-5ポイントとか、そんな感じで確か決まっていくんですよね。

井上)そうですね、将棋とかだとそれは分かりやすいですね。例えば報酬が期待見込みといったのも、別に角を取られたからといって負けるとは限らないわけですよね。でも角を取られてしまうと報酬としてはかなり下がってしまうというような。実際にも基本的には不利になってしまいますし。..ただ最終的には勝てれば良いので。

石井)凄く人工知能って高度なことだと思うんですね、将棋のアプリって最近強いじゃないですか、iPhoneのアプリでも。でもあれは強化学習ではないんですよね、きっと。単純にロジックだけで手を決めてる..?

井上)そうですね。こういう局面だとこう指すということを決めているのだと思います。

石井)勝手に頭は良くならないですもんねiPhoneのアプリは。

井上)そうですね、あれは人間がある程度作って、試して。このくらいの強さだというのをだいだい測って、リリースするということだと思います。

石井)それが強化学習になると、勝手に頭が良くなるので計算の量が違ってくるんですかね?..あとはロジックの組み方だったりも。

井上)ロジック自体は変わらなくて、データの量と計算の量で大体(能力が)決まって。記憶が曖昧なんですけど、アルファ碁は一秒に2000局読むとか..聞いて。(正確には一秒で10万手を検索するらしいです。)すごい速度で(コンピュータ同士で)対局して、それを繰り返すことであんなにも強くなったという話です。機械学習の特徴として、「データを制する者が機械学習を制する」というところがありまして。多少のアルゴリズムの優位性は、データの量が全てを覆してしまうような感じなんですよね。

石井)なるほど。分かりやすいですね。

井上)だからこれからは、どんな企業もデータを(できるだけ多く)持つしかなくて。データが武器になるような時代になると思います。

石井)..分かりました。ありがとうございました。井上さんと、機械学習についてお話ししました。次回はですね、ディープラーニングについて語りたいと思います。はい、皆さんお聴きいただきありがとうございました。一旦失礼します。

井上)ありがとうございました。

石井)さようなら〜。

--

--