令和のデータ分析グループの在り方を示す3つの「民主化」
はじめに
こんにちわ。FiNCデータ分析グループのこみぃです。
まもなく平成が終わり令和が始まるということで、今後のFiNCのデータ分析グループというのがどうあるべきか、それに向けて今どういうことをしているもしくはしようとしているかというのを、覚悟も込めて書いてみました。
今日の内容は、「データと人の付き合い方について」の私自身が考える未来予想図とも言えます。私にしては非常に珍しく、真面目な内容ですね。私の平成最後のブログになると思いますので頑張って真面目になってみました。
そんなわけで、さっそく行ってみましょう。
データの民主化
FiNCが現在使っているredashのような、オープンソースで使い勝手のいいBIツールが現れたのはここ3, 4年くらいの出来事です。
それまで大抵の会社のデータ分析はというと、まずデータを分析するのにある程度のスキルや権限が必要でした。そうして抽出したデータをExcelやスプレッドシートで集計し、朝会なり週次の定例なりで共有というのが一般的だったと思います。
今やBIツールの導入が一般的になり、誰もが日常的にダッシュボードを見ることができ、少し勉強すればデータも自分で取り出せるという時代になっています。データの共有もSlackのようなチャットツールに投下してその場ですぐ議論というようにデータを閲覧し、データをもとに議論する場も増えていっています。
この流れをFiNCデータ分析グループでは「データの民主化」と呼んでいます(これを読んでいるみなさまも同じように呼んでいるかもしれませんね)。
「データの民主化」の流れが今後も加速していくことは間違いありません。なぜならデータを見たほうがプロジェクトを成功に導きやすく、よりプロジェクトを成功させた企業が生き残っていくからです。
データが自然に目に入ることが当たり前、みんながSQLを書けるのが当たり前(将来的にはSQLを書く必要すらなくなるでしょう)、データをもとにした議論にみんなが参加するのが当たり前。そんな時代が間違いなくやってきます。
データの民主化にむけての取り組み
さて、それではデータの民主化に向けてデータ分析グループが取り組むべきことはなんでしょうか。FiNCデータ分析グループで取り組んでいることは2つあります。
1つ目は、データ基盤をしっかりと整備することです。
ここで言っている基盤というのはいい感じに中間集計したテーブルを設計して用意するというのも含まれます。
これにより簡単なSQLで欲しいデータを抽出できるようになることでデータの抽出のハードルを下げることが出来ます。
また、膨大な量のローデータが入ったテーブルへのアクセスをなくすことでクエリへの習熟度の浅い社員が重いクエリを書いてredashやRedshiftを落とすリスクを軽減することにも繋がります。
2つ目は、利用者の安全を担保することです。具体的には分析用データベースから個人情報等のインシデントにつながる情報を排除することです。
データを抽出するのが限られたメンバーだけである場合、その中に個人情報が入っていることはそこまで問題になりません。それはつまり強い権限と、それに伴った大きな責任を持っている人物のみがデータにアクセスするという状況です。社内の限られたメンバーのみが漏洩の危険を理解して業務に当たればよいからです。
しかし、あらゆる社員がデータの抽出を行える状態では話が別です。その状態はすべての社員が個人情報漏洩のリスクを抱えている状態であるということです。いつ自分が個人情報漏洩の原因になってしまうかわからないという状況では、社員は心配で食事も喉を通らないでしょう。FiNCはヘルスケア企業ですから、社員が安心して食事を取れる体制は他の企業よりもしっかりと担保しなくてはなりません。安全に安心してデータを利用できる体制を担保するためには、個人情報を分析用データベースから排除する必要があります。
以上の理由から、FiNCではRedshiftに個人情報を入れていません。redashやRedshiftの権限管理で個人情報へのアクセスを制限するのではなく、そもそもRedshiftに個人情報を入れないのです。新しくRedshiftに入れるデータについても常に内容を精査しています。
データ分析手法の民主化
さて、データが民主化された次に起こることはなんでしょうか。
FiNCデータ分析グループは、「データ分析手法の民主化」が来ると考えています。
「データの民主化」については、すでにその波が十分に来ている企業は少なくありません。施策を打つにあたってプロデューサーやプランナーが自らデータを抽出し、分析している状態ですね。FiNCもこれが主流になりつつあります。
しかし、どういうときにどういう分析手法を使うのが適切かということについては、意外と統一されておりません。
なので、現在は「使うことが出来る分析手法とそれを使うタイミングを熟知していることが分析者という職業を成り立たせている専門スキルである」と言えます。
今後データが民主化されていき、あらゆる人々がデータの扱い方を学ぼうとする流れになるのであれば、こういった知識や技術もまた民主化されていくことでしょう。多くの人は正しい知識を求めますし、多くの人が求めるものは必ず体系化されて共有されるからです。データのみでなく、データ分析というスキル自体も民主化される時代が来ます。
この「データ分析手法の民主化」が今後起こり得ると考える理由はもう1つあります。
それは「社員それぞれがデータ分析の手法を正しく理解していながら業務を行っている会社の方が成果を出す可能性が高い」と考えられるからです。
望むと望まないと、生き残るためには正しい分析知識を持っていなければならないという時代が、遠からず来るでしょう。
データ分析の民主化にむけての取り組み
では、「データ分析の民主化」の時代に向けてデータ分析グループが取り組むべきことはなんでしょうか。
それはずばり、社内での「データ分析の民主化」を促進することです。「データ分析の民主化」を行ったほうが会社のためであるなら、それを促進するべきなのは考えるまでもないでしょう。そして、それはデータ分析グループの役目のはずです。
具体的にFiNCデータ分析グループが行っている取り組みを紹介します。
1つ目はどういうときにどういうデータをどうやって見ればいいかという知見の共有の場を作ることです。具体的には以下の2つを取り組んでいます。
- データ分析の基礎を教える会を開催する
- 毎週特定の時間は「データ分析グループに自由に相談していい時間」として場を設ける
前者はこれまでは関係した社員に口伝で伝えたりしていた分析作業の基礎のようなものをしっかりと時間を取って教える会を開くというもので、2019年の1Qから開始した試みです。この試みによって、それまでにもデータ分析を実質的に行っていた社員のスキルを向上させるとともに、新たに分析に取り組む社員も現れています。
後者はメルカリのBIチームが行っている「ゆるふわBI」を真似して取り入れた試みです。前者の会に参加してくれた社員にヒアリングしたところ需要があったこともあり、実施することに致しました。週2時間ほど分析チームがオープンスペースで作業している時間があり、その時間は相談自由としています。
その他にもSlackで気軽に分析の相談ができるチャンネルを用意したりなど、色々な取り組みを行っています。
2つ目は自分たちが分析した作業の記録を残すことです。
FiNCデータ分析グループでは、分析作業を行った場合に単純に結果だけをSlackで共有するのではなく、レポートという形でドキュメントを残すことを推奨しています。こうすることで、どういうときにどういう分析を行ったのかを分析チーム以外の社員も簡単に参照できるようになり、知見の共有が促進されます。
データ分析に興味をもった社員に例を見せやすいという意味でも、非常に大切な試みですね。
AIの民主化
「データの民主化」及び「データ分析手法の民主化」とは別で、今後確実に来るであろうと考えられるのが「AIの民主化」です。
かつては一定以上の知識とエンジニアスキルが要求されていたAIの利用ですが、すでにエンジニアスキルをほとんど持たなくてもある程度のことができるツールが世の中に出始めています。AI技術を提供するようなベンダーも増えています。
内閣府が発表しているSociety 5.0や、それに向けての学習指導要領の改善に向けての取り組みを見ても、今後「AIの民主化」はますます進んでいくでしょう。
参考:https://www8.cao.go.jp/cstp/society5_0/index.html
そして「AIの民主化」は間違いなく分析手法にも変化をもたらすでしょう。すべての人がAIの知識を持ち、AIを用いた分析手法も簡単に利用できる世の中が、いずれやってきます。
AIの民主化にむけての取り組み
「AIの民主化」に向けてデータ分析グループがすべきことはなんでしょうか。
これについては正しいと思えるほどの自信はありませんが、FiNCデータ分析グループとしてはAIについての正しい知識を習得して利用をリードしていくことだと考えています。
他の社員がAIを用いた分析を当たり前にできるような会社になるために、データ分析グループがまず積極的にAIについて勉強し、普段の分析業務に取り入れていく必要があるでしょう。
3つの民主化のその先に
ここまでに話した3つの「民主化」のその先にあるのはどんな世界でしょうか?
私はデータ分析者という職業がなくなった世界だと思っています。すべての人が当然のようにデータ分析ができるようになった結果、データ分析をするということに長けているだけでは職業として成り立たなくなった世界ということですね。
もちろん「学術的にデータ分析という技術を研究する」という職業は残ると思います。しかし、現在一般的に「データアナリスト」とか「データサイエンティスト」とか呼ばれている人たちというのは、徐々に減っていくと思います。彼らが持つ優位性がもはや優位性ではなくなる時代が、来るのですから。
専門でやっていた分だけ他よりも多少は秀でている分析技術を以てプランナーやプロデューサーになるような道に進むか。エンジニア系のスキルを活かしてAIエンジニアやデータ基盤エンジニアのような道を進むか。はたまたそれ以外の第三の道が現れるか。個人的には第三の道がいくつか現れると思っていますが、実際そうなるかどうかはわかりません。
今、社内で率先して3つの民主化を進めている私は、将来の自分の職をなくすために日々の作業に精を出していることになりますね。そう考えるとなんとも不思議で、滑稽で、恐ろしい話にも思えます。
勘違いしないで欲しいのは、いま分析者という立場にいる人々を失業の恐怖に陥れたいためにこう書いているわけではありません。そのときになって絶望に駆られないように、自分の将来のキャリアについて考えることが必要であると言いたいのです。
最後に
今日の内容をまとめると、こんな感じでしょうか。
- データの民主化に向けて、みんなが簡単に利用できるデータ基盤を作ろう
- データ分析手法を積極的に共有しよう
- AIについて勉強しよう
- 将来自分がどういうキャリアを歩みたいのかをちゃんと考えよう
いかがでしたでしょうか?
共感いただける点や議論、反論したい点などあればドシドシご連絡いただければと思います。
では、今回はこのあたりで!