多くの企業がデータサイエンティストを活かしきれない4つの理由

Kan Nishida
7 min readFeb 7, 2018

おそらく日本も同じ状況だと思いますが、特にこちらUSではデータサイエンティストという職はたいへん人気があり、給料もよく、仕事の満足度も高く、ワークライフバランスもいいと言われています。(リンク)

つい最近も、仕事先探しで有名なGlassdoorが発表していたアメリカのトップ50という職種リストでは3年連続で1位となっていました。(リンク)

しかし、だからといってデータサイエンティストを雇ってデータサイエンスのプロジェクトを始めると何かすごい事が起きるというわけではありません。先週そうしたデータサイエンティストを企業が雇ってデータサイエンス関連のプロジェクトを始める時に犯す失敗について書いてある記事が2つほど出ていたので、ここで紹介したいと思います。これからもさらに多くのデータサイエンス関連のプロジェクトを始める機会があると思いますので、その際に参考にしていただければと思います。

  • Why Are Data Science Leaders Running for the Exit? — Link
  • Are You Setting Your Data Scientists Up to Fail? — Link

以下、要約

マネジメントの罠

多くの会社で、せっかく雇ったデータサイエンティストが失敗してしまう、もしくは期待したような成果が出せていないとき、その大抵の場合はデータサイエンティストをうまく管理(マネージメント)できていないからです。最悪の間違いは、スマートなデータサイエンティストをたくさん雇って、データへのアクセスを可能にし、あとはたいしたガイドも与えずにほったらかしにした上で、何か素晴らしい発見を自ら持ち込んでくることを期待してしまうことです。

データを使って解決できる問題を明確に定義した上で、データサイエンティストをそうした問題を解決できる最適な場所に配置すべきです。マーケティングの最適化に関することであれば、マーケティング部署に配置すべきであり、石油の採掘の最適化であればそうした作業が行われている場所に近いところに配置すべきであり、何か新しい製薬の発見に関することであれば研究所に配置といった具合です。まずはデータに関するパイロットプロジェクトを始めるといった場合でも、明確に定義されたゴールを設定してからデータサイエンティストを配置すべきです。

多くの人がデータサイエンスをビジネスのプロジェクトでなく、ITのプロジェクト、またはイニシアティブとしてとらえてしまっているというのもよくある間違いのパターンです。

アカデミアの罠

多くの特に大企業が間違えるのはデータサイエンスをやるのにはPhD(博士号)が必要だと思ってしまうことです。ある特定の狭い領域に限っての深い知識を持っているPhDの人たちは、データサイエンスのように様々な領域に渡る知識、経験を必要とする仕事に対しての適応力が高いとは言えません。ですので、こういった人たちを連れてきて、さらにデータサイエンスチームのトップに据えるのではなく、ビジネスのわかる人間をトップにおいてその下で支える立場にこういった専門家を持ってくるほうが、データサイエンスのプロジェクトを成功に導きやすいです。

アジャイルの罠

ソフトウェア開発で効果を発揮するアジャイル開発ですが、これをデータサイエンスのプロジェクトに応用しようとするとおかしなことになります。ソフトウェア開発が段階的に作り上げていくものであるのに対して、データサイエンスは発見することに意義があります。必要なデータが集まらなければ意味のある発見はまったくなく、その場合には、ソフトウェア開発のように段階的にリリースしていくべき意味のある成果物と言うものがないわけです。

コミュニケーションの罠

別の問題として、コミュニケーションがあります。データサイエンティストが話す内容がそのメリットを受けるはずのビジネスサイドの人間に理解しにくいことが問題です。このコミュニケーションに関しては、何もデータから得られたインサイトの説明に関するものだけではありません。データサイエンスのプロジェクトでは最初に問題のフレーミングを行うことになりますが、データサイエンティストがデータを使って答えようとしている問題をどう定義しているのか、なぜそのように定義しているのかといったことも、データサイエンスや統計のバックグランドのない人間にはわかりにくかったりするわけです。

せっかくデータを分析して得られたインサイトであったり、予測であったりしても、その背景、もしくはなぜそう言えるのかということが説明できなくては、結局は何の行動にもつながらず、ただの時間の無駄となってしまうわけです。

以上が要約です。

私も様々なお客様と話しててかんじるのは、現在、AI、データサイエンスに詳しくない人たちの間に過剰な期待と低すぎる期待があるように思います。過剰な期待とは、何かマジックがおきて難しい問題が一気に解決してしまうと思っていることで、低すぎる期待とは、実は今の時代であれば簡単に解決できることでも、難しいと思いこんでしまっているがために、問題としてそもそも机の上にすら上がってこないことです。

こうした認識のギャップも、実際にデータサイエンティストが多くの会社で活躍しきれていない現状を生み出してしまっているのではないでしょうか。

これからどんどんとAI、データサイエンス、データ分析に関するプロジェクトは増える一方だと思いますが、安易にデータサイエンティストを雇っても、実際のビジネスで抱えている問題が解決することはありません。まずは何が問題になっているのか、それがどうデータで解決できるのか、ほんとうにデータサイエンティストを雇う必要があるのかということをしっかり議論すべきです。そして、雇う必要がある場合はどういったタイプのデータサイエンティストが必要なのか、どの問題を解決するのに必要なのか、どこに配置すべきなのかということを具体的に議論するべきでしょう。

社内の人間が、AI、データサイエンスを使うと何ができて何ができないのかしっかり理解できていると、こうした議論も活発にしやすくなると思いますので、そうした社内教育こそ、まずは早いうちから取り組んでいくといいのではないでしょうか。

データサイエンスを本格的に学んでみたい方に

手前味噌になりますが、この3月の下旬に、Exploratory社がシリコンバレーで行っているトレーニングプログラムを日本向けにした、データサイエンス・ブートキャンプが東京で行われます。データサイエンスの手法を基礎から体系的に、プログラミングなしで学んでみたい方、そういった手法を日々のビジネスに活かしてみたい方はぜひこの機会に参加を検討してみてください。こちらのホームページに詳しい情報があります。

--

--

Kan Nishida

CEO / Founder at Exploratory(https://exploratory.io/). Having fun analyzing interesting data and learning something new everyday.