ビジネスで活用する計算社会科学

Ryo Adachi
DeNAデータ分析ブログ
9 min readDec 18, 2023

--

この記事では, 大規模データの分析観点から近年注目を浴びている“計算社会科学”の紹介と, これを事業会社において推進するための3つのポイントについてお話しします.

計算社会科学の成り立ち

計算社会科学とは, 大量のデータやその分析手法を駆使し, 個人や集団, そして社会における人間行動やそのダイナミクスを定量的に研究する学際分野を指します (Lazer et al., 2021) . 人間の活動を記録するためのデバイス (e.g., スマートフォン, ウェアラブル端末) の発展や, SNSなどオンラインでの活動の増加による行動データの大量蓄積, データ処理のためのマシンパワーの向上と分析手法の開発を背景に, 2010年代から急速に発展してきました. 社会科学とコンピューターサイエンスの融合 (図1) ともいえるこの分野では, 多岐にわたるドメインデータを対象に, 古典的な分析手法から最新の機械学習手法までを活用した研究, 実応用がなされています.

社会科学の定量研究はおおまかに, 実験と観察データの分析に分けられます. 実験には, 検証したい仮説に関わるノイズを実験の設計段階で極力除去できるメリットがある一方, 現実を反映しているとは言い難い環境 (i.e., 実験室) での行動データを収集している, というデメリットがありました. 観察データの分析は, これと反対の特性を持つ上に, データの取得が難しいというデメリットもありました. しかし上述の通り, 近年では大量の観察データが, 整ったフォーマットで安価に取得できるようになったため,この系譜の分析が大きく進展しました. 計算社会科学もこの一部であるとも考えられます. 近年の進展により, これまでよりも多角的に, 人間の行動, 社会のダイナミクスの理解が促進されることが期待されます.

図1:計算社会科学の全体感 (Zhang et al., 2020 より引用)

情報収集はどこでする?

図1に示される通り非常に学際的な分野であるため, 幅広い学会, 論文誌において研究成果が発表されています. その中でも特に, KDD, NeurIPS, ICMLといった機械学習系カンファレンスや, WSDM, WWW, ICWSMといったWeb系カンファレンスでの投稿が多くみられます. また近年, 計算社会科学分野の研究に特化したカンファレンス (IC2S2) も発足しました. 国内では, 人工知能学会, 計算社会科学会において研究発表, 交流が行われています.

学際的な分野は最新情報を網羅的に把握することが難しいため, 学会や輪読会などを通じた研究者間での情報共有が大切になります.

ここで計算社会科学の研究を2つ紹介します.

研究例1

Spillover of Antisocial Behavior from Fringe Platforms: The Unintended Consequences of Community Banning. Russo et al., ICWSM, 2023

SNSや掲示板のようなコミュニティサービスにおいて, サービス規約に違反したコミュニティを運営が閉鎖することは一般的で, サービス全体の規範を維持するために“良いこと”として捉えられてきました. この研究では, コミュニティ掲示板サービスであるRedditのデータを用いてこの定説を検証し, これが必ずしも正しくないことを示しました.

具体的には, 規約違反コミュニティを閉鎖しても, そのコミュニティに所属するユーザーが同様のコミュニティを他サービスで継続する行動がみられました. さらに, その過程で彼らの発言の攻撃性が上がり, 元サービスでの攻撃性の高い発言につながり (図2) , 元サービスの他コミュニティに悪影響を及ぼす可能性が示されました. このため, 運営側は単にコミュニティを閉鎖するだけでなく, コミュニティの所属ユーザーの発言を他ユーザーから見えづらくする, などの対処がコミュニティマネジメントの観点から必要であることが示唆されます.

この研究のテーマである“コミュニティ閉鎖がサービス全体に与える影響”は, 実験では設計が難しく, Redditなどのオンラインコミュニティの大量の観察データを活用して始めて検証可能になります. 他に, Russo et al., 2023bにおいても同様の観察データを用いた研究がなされています.

図2:コミュニティ閉鎖による悪影響の可能性 (Russo et al., 2023a より引用)

研究例2

Large-Scale Analysis of New Employee Network Dynamics, Yu et al., WWW, 2023

次に, 新入社員のオンボーディング過程でのコミュニケーションの分析を紹介します. 本研究では, 2022年1–3月にマイクロソフトに入社した1万人を対象に, Microsoft Teams上でのミーティング, チャット, メールのやりとりの分析を行い, 会社での役割によるコミュニケーションの違いを明らかにしました.

具体的には, エンジニア職や非マネージメント職の新入社員の方がコミュニケーションをとる相手の数, 頻度, 多様性において恵まれない状況にあり, 既存社員に近づくまでの期間も長いことが示されました (図3).

オンボーディング過程における社員間のスムーズな関係値形成は普遍的なテーマではありますが, データ取得の観点から分析することが困難でした. 本研究はTeamsを保有するプラットフォーマーとして取得できるユニークなデータを活用した研究といえます. このように, 研究として対外発信しつつ, 分析結果を社内オンボーディング過程という業務改善に活用する, 研究と事業活用の両立のひとつのロールモデルといえます. 他には, Mok et al., 2023においてマイクロソフト社内におけるミーティングのデータを活用した研究が行われています.

図3:オンボーディング過程における, マネージャー職とそれ以外の社員のコミュニケーションパターンの比較 (Yu et al., 2023 より引用)

計算社会科学のこれから〜事業会社で活用するために〜

この分野の研究を行う上で, 産学連携が非常に大切と考えています. なぜなら企業には様々な種類の大規模行動データが蓄積されているからです. しかし残念なことに, プライバシーやリスクの観点から, 近年では企業がデータのオープン化に積極的とは言えません (e.g., X/TwitterのAPI仕様変更). このため, 研究者と企業の担当者の綿密な議論を通じ, 研究として普遍性があり, 企業側からもビジネスに有益な, 双方にとってメリットのあるテーマを見つけていくことが大切になります. また, 単発の共同研究で終わってしまうと再現性・透明性に難があるため, 継続的に研究成果をビジネスに活用させていく協力体制の構築も必要です.

弊社でも, 計算社会科学の事業活用の取り組みを始めており, その過程で

① 事業リーダーと共に, 研究テーマ候補の議論, 適用価値の高いテーマの選定, 分析ゴールの設定を行う
② 論文化を念頭に, 定めたゴールを達成する分析を行う (テーマがぶれることを防ぐため, 途中で事業側と議論はあまりしない)
③ プロダクト責任者と分析結果の議論と活用をすすめる

という座組みを構築しています (図4). これにより, 研究としての独立性は保ちつつ, 事業上の重要人物を巻き込みながら, 事業に非常に近い部分で分析を行なうことができています.

図4:ビジネスで計算社会科学を活用するためのプロセス

ビジネスにおける計算社会科学の可能性

この取り組みを進める中で, 計算社会科学をビジネスに活用する大きな可能性を実感しはじめています. 今や事業会社にとって, ミクロ的な分析である施策の効果検証やユーザーの離脱要因分析などは必要不可欠です. しかし, サービスを運用していくためにはサービスのエコシステムを理解し, そのダイナミクスを正しく認識するマクロ視点の分析も必要になります. 短期的に即座に効果が期待できるミクロ分析がビジネスの現場では重視されてきましたが, 中長期目線でサービス設計を考える上で, ミクロ視点を補完し, 事業運営への有用な知見を提供できるフレームワークが”計算社会科学”である, というのが私の実務での実感です.

最後に

弊社では今後, 計算社会科学、そして社会科学全般を活用した事業活用の取組みを推進していきます。ディスカッションなどはお気軽にDeNA 安達 (ai_social_ds_my@dena.jp) にご連絡ください。

--

--