機械学習民主化の試みと、そこに立ちはだかる壁

Keisuke Yutsudo
FiNC Tech Blog
Published in
8 min readJan 28, 2019

こんにちは、FiNC Technologiesでデータチームのマネージャーをしている@yutsudoと申します!
先日、AmazonSageMaker事例祭りで登壇をさせていただきましたので、登壇内容を書き起こしました!

一緒に登壇をさせていただいた、スマートニュース株式会社様、株式会社ミクシィ様、株式会社SIGNATE様の事例紹介はこちらで公開されております。(各社、SageMakerを非常に上手く活用されていて、非常に参考になりました)

今回、私が発表させていただいたテーマは
『機械学習の民主化』です。

ここで『民主化』という言葉の意味を正しく理解したいと思う。

みんしゅ‐か【民主化】
[名](スル)考え方・制度などが民主的なものに変わっていくこと。また、そのように変えていくこと。「職場を民主化する」
出典元:コトバンクより転載

つまり、機械学習の民主化とは
「FiNCの誰もが機械学習というものを理解し、みんなでFiNCの機械学習をどうするべきか?を議論できる状態にすること」
です。

データサイエンティストや機械学習エンジニアのみならず、PM、営業、人事、広報、財務、インターンやアルバイトを含み、『組織やチームにどう機械学習を活かすべきか?』を考える必要があります。

そんなことする必要はあるのか?
そんなことできるのか?
自分の会社には関係ないのではないか?

大半の人がそう思っているかもしれません。
組織の誰もが機械学習について習熟していなければ、時代に取り残されてしまう日が必ずやってきます。

僕らも取り組み始めたばかりで、課題は山積みだし本当に実現できるのかも全くわかりません。ただ、どんな取り組みもやってみないとわからないと思います。

僕としては、同じような取り組みをする組織が増えて、その結果をドンドン発信してくれると非常に嬉しいです!!
だから、僕らもできる限りさらけ出していこうと思う。

モトム!機械学習の民主化を実現した事例!

なぜ機械学習の民主化なのか?

時はさかのぼり2017年、FiNCで何が起こったか?
記念すべき、FiNCアプリのリリースです。
時を同じくして、データ分析グループは生まれました。

当時の役割は『正しい数値を出すこと』と『グロースポイントを見つけること』。ナレッジもなければ、環境も整備されていなかったので、アプリユーザーの継続率を出すだけでも数日かかったり、追うKPIが下がった要因を探すためにチーム全員(当時は3人)で数日にわたり何時間もかけて分析していたりしました。

今となっては考えられませんが、当時はそんな状況でした。

その時の課題感は『施策のKPIが決まってないこと』と『施策の評価ができていないこと』でした。
年末に2017年に実施した施策と効果を振り返ったのですが、目を疑いたくなるような数値でした。(数値は言えないのですが、気になる方はランチでも行きましょう!)

そういったこともあり、2018年からは各施策で正しくPDCAを効果的に回していこうと決めました。その際に参考にしていた本はイシューからはじめよ(著:安宅和人)です。僕らと同じような悩みを持っているデータチームにおすすめです。

ただ、PDCAを回すにもどんな施策が実施されているかを知らないと振り返りもできません。なので、機能や事業毎にデータアナリストの担当をつけて、担当者が責任を持って振り返りができる体制を敷きました。

結果として、KPI設定、ダッシュボード整備、分析レポート報告などが当たり前の状態になってきました。

こうなってくるとPDCAが回るので、機能や事業の個別最適化が少しずつできるようになってきます。
結果としてぶち当たったのが、課題のモグラ叩きです。
あっちの課題を叩いたら別の課題が出てくる。その課題を叩いたらまた別の課題と、機能や事業を跨いでモグラ叩き状態になり始めました。
(FiNCの特徴として一つのアプリに様々な機能が含まれているため、こういった問題が起きやすくありました)

それらの問題を解決するためには『機能や事業を横断して最適化すること』が必要で、そのためにはユーザー毎にパーソナライズした体験を提供しなければならないと考えていました。

機能や事業を横断して最適化するためには、分析担当はもちろん、部長や企画、エンジニアなど関わる人間は全員、どうしたら最適化できるのかを考えて議論ができる必要があります。

ただ、これはほとんどの部署で同じことが言えると思うのですが、機械学習を利用しようという選択肢がなく、仮にあったとしても魔法だと思われています。

例えば、
・プッシュ通知をこれまでの類似プッシュ通知の開封率を参考に、調整できるかもしれない
・アポの音声データを書き起こしたテキストデータを参考に、受注につながるキーワードがわかるかもしれない
・これまでの購入ユーザーの傾向を参考に、ユーザー毎に進めるべき商品やおすすめする最適な順番がわかるかもしれない

こういったことを誰もが当たり前のように思いつき、当たり前のように企画化されるそんな組織になる必要があると僕らは思っていました。

FiNC秋の機械学習まつりの開催

詳細は別記事に記載しているので、細かくはお伝えしませんが、大きく4つのポイントがあります。

1.誰でも参加可能

通常業務で機械学習やそれに近いことを扱う社員以外でも参加してほしいという思いから、誰でも参加可能としました。
結果的には、普段エンジニアと接しないような人からも『こういったことがやりたいと思ってた』といったお声が集まりました。

2.SageMakerを利用

参加者毎に使用しているPCのOSなどが異なることが予測されたため、共通した作業環境をそれぞれに用意することがよいと考えました。なので、インスタンスを立てれば作業環境が量産でき、ネットワーク設定等も揃えられるのでSageMakerを利用することにしました。

3.実装して、アウトプットを提出

今回の企画の狙いとして、『こんなことやりたい』といった企画を実現して成果を出す。という目標があったので、実装してアウトプットすることをマストにしました。
結果的に、提出者はほぼエンジニアとなってしまいましたが、ここは次回の改善ポイントになると思っています。

4.アウトプットは評価して表彰

実際に結果が出たアウトプットは全社会議で報告をさせていただきました。参加をしていなかった人達も、機械学習ってこんなことできるんだぁって思ったのではないでしょうか。

機械学習まつりの詳細は以下↓

機械学習まつりで民主化は進んだのか?

↑のスライドに書いてあるような空気感がなんとなくできたような気もしますが、正直まだまだ道半ばです!
やりたいことを実現しきるためには、他社の事例や最新の論文などを定期的にインプットして、自社で使えそうなものは積極的に試し、組織全体のデータリテラシーをもっと上げ、成果が出る機械学習のプロジェクトをたくさん立ち上げる必要があります。

ちなみに、これから第2弾の企画が進行中ですので、そこで得られた知見も発信していきたいと思います!

FiNCのデータチームや今回の取り組みに興味がある方は気軽にご連絡ください!

登壇時の資料は以下です

--

--