データが先か,仮説が先か,それが問題だ

Data fast or issue fast, it's the problem.

Daiki Enomoto
THE Telepathy. -books, ideas and future-
4 min readSep 18, 2016

--

ビジネスの場面において,よく「仮説思考」って聞きます.

有名なビジネス書で安宅和人さんの「イシューからはじめよ」という書籍がある(学生時代から社会人になりたてのときまでだいぶお世話になっている)が,要は「何か問題解決に臨むときに,仮の結論(=仮説)を見立てておき,その仮説を検証する方向性で解決に取り組む」ということ.

むやみに多面的なデータを集めるのではなく,先に仮説を設定しておくことで効率的に検証でき次の課題設定ができるというメリットが有るというわけだけども.

昨年出版された矢野和男さんの「データの見えざる手」を読んだら,ひょっとして自分の「仮説思考」に対する理解は表面的なものだったのでは?と思い直して文章を書いてみます.

「データの見えざる手」のハイライトとしては,

1日の身体運動の分布は動きの総数というたった1個の変数でおおよそ決まってしまう(中略)これを我々は「活動予算」と呼んでいる.

人間の活動量や激しさは有る一定の法則に従っており,24時間全力投球もできないし,だらりと過ごしているだけもできない.一日に動きの激しさごとに一日に使い切らないといけない.

より具体期に言うと,
1分間に60回以下の動きを伴う活動は,活動時間全体の半分ほどを,
1分間に60〜120回の動きを伴う活動は,活動時間全体の1/4ほどを,
1分間に120〜180回の動きを伴う活動は,活動時間全体の1/8ほどを,
・・・と言った具合に.不思議すぎる.

「多様か,統一か」・言葉の上ではどちらか一方が正しく,他方が間違っていると聞こえる.(中略)「多様性」と統一的な「法則性」を矛盾なく説明するために,方程式にはある特徴がある.それは,方程式が時間軸上で状態がどれだけ急に変化するかであることだ(これを数学では「微分」と呼ぶ).(中略)「現在の状態から次の瞬間の状態が創られる」ジェネレータを表す言語が「微分」である.

微分という仕組みにより,方程式を場として多様性と統一が共存する.とっても美しい関係性であることに感動するし,仮説とデータの相補性を見出すことができる.

仮説→データ収集の一方通行ではなく,毎瞬間ごとのデータにより変化を捉え,予測し,次なる仮説を立ち上げる.

ビッグデータで儲ける3原則は,以下のようなものである.
第1の原則 向上すべき業績(アウトカム)を明確にする
第2の原則 向上すべき業績に関係するデータをヒトモノカネに広く収集する
第3の原則 仮説に頼らず,コンピュータに業績向上策をデータから逆推定させる

筆者が最も重要でありながらこれまで守られなかったというのが第3の原則である.つまるところは「コンピュータに仮説を作らせる」ということだが,これが最初に言った「仮説思考」を推進するビジネスシーンのスタンスとある部分では矛盾するところだ.

今までは,大量のデータを基に計算するマシンがなかったから仮説ファースト・データ検証という不可逆なプロセスが当たり前になっていたが,これからは,マシン性能の向上やDNN技術により,可逆的な関係性になると言える.

つまり,データファーストでも良いということだ.
誤解を恐れずに言えば,データファーストか仮説ファーストかは問題ではないという世界だ.

とはいえ,これまで見過ごされてきた新たな事実や仮説をデータからマイングすることもできるだろうし,多様と統一の行き来により次なる予測の精度を高める事もできるかもしれない.

人間の芸である「勘」ですら,
データと仮説の往来によって既知のものになるかもしれない.

--

--

Daiki Enomoto
THE Telepathy. -books, ideas and future-

Researcher at LITALICO Inc.「テレパシーがある未来を創り出す。」をテーマにしています。