データがやってきたら、まず何をやるべきか（後編）

武田邦敬

Published in

クニラボ技術ブログ

Sent as a

Newsletter

Feb 28, 2024

こんにちは。ニュースレター「人事データ分析入門講座」講師の武田です。本日もよろしくお願いします。

このニュースレターでは、人事データ分析に取り組み始めた方に向けて、データ分析の考え方や方法をお伝えしています。本レターで7回目の配信となりました。

今回は昨年末に配信した「データがやってきたら、まず何をやるべきか」の続きになります。

前編では、データ分析を始める前にデータの発生源を押さえるため、What, Where, When, Howという観点で確認することをお伝えしました。本レターでは、Whoという視点でデータの外観を捉えることをお伝えしていきます。

手元に人事データがやってきたとき、「そのデータには誰が含まれているのか？」と問うことは大変重要です。

人事データ分析の主軸は人と組織です。

組織が人の集合体と考えると、データの外観を捉える上で「誰が」という切り口はもっとも大切な要素といえます。

3つの観点でWhoを考える

皆さんの手元に人事データやサーベイの結果があったとします。さて、このデータはどのような経路をたどってやってきたのでしょうか？

前編で取り上げたWhat, When, Where, Howという問いと向き合っていれば、概ねイメージはできていると思います。

例えば、勤怠データであれば、勤怠管理システムからしかるべきタイミングで抽出されたものでしょう。また、エンゲージメントサーベイであれば、実施時期や回収率なども大切な情報ですね。

この流れをざっとまとめると、以下のようなイメージになります。従業員と組織から始まり、システムを経てデータが抽出されたということですね。逆に言うと、手元のデータの出所を遡っていけば、抽出元のシステムやサーベイがあり、その先には「人」が存在しているわけです。

データがやってくる流れ

ところで、私たちが人事データ分析を行うとき、その関心は常に「従業員や組織」に向いています。それは、分析対象が勤怠であってもエンゲージメントであっても同じです。

そして、私たちの試み、すなわち、人事データを分析することによって人事的な課題解決を図ることは、手元のデータからその根本的な発生源である人の振る舞いや特徴を捉えることに相当します。

これを図にすると以下のような形になります。一見すると当たり前の話に見えますね。

人事データ分析は何を目指すのか

ここでWhoという観点で、以下の点が気になります。

手元のデータにはどの程度「従業員や組織」の情報が含まれているのか。
データ抽出元のシステムやサーベイは「従業員や組織」をどこまでカバーしているのか。
そもそも私たちが関心を寄せている「従業員と組織」とはどのような形をしているのだろうか。

つまり、上の図で表した「データ」「システム」「従業員」それぞれについて、どんな人が含まれているのか知っておきたくなるわけです。

人事データ分析に取り掛かるときには、これら3つの切り口でWhoを考えてみることが大切です。

1つ目のWho：データ

もっとも分かりやすい切り口は、手元のデータに含まれる従業員や組織を確認することです。データ分析者が自分の裁量で確認できることでもあり、人事に限らず人に関連するデータ分析プロジェクトでは、初手としてマストではないかと考えています。

全従業員のデータを分析対象とした場合であっても、必ずその外観を捉えることは大切です。抽出過程でデータが欠落しているかもしれませんし、抽出タイミングによってデータ同士の関連が崩れていることもあります。

人事データでは、次の点について特に注意すべきです。

システムからの抽出条件によって、部分的なデータ抽出となる可能性があること。
現時点でアクティブであるかどうかなど、退職・休職他のステータスを考慮すべきであること。
出向、他団体への派遣、海外駐在、兼務など人事特有のステータスを確認すること
データ抽出タイミングによって、年途中採用・退職者に関するデータが想定とずれる可能性があること。
人の配置情報、上司と部下の関係が抽出タイミングに依存すること。

これらを確認するために最も手っ取り早い方法は、「人の数を数える」ことです。人事部門が把握している人数とデータに含まれる従業員の数を突き合わせてみるわけですね。

ここでいう件数は、データそのものの件数だけでなく、そこに含まれる従業員のユニークな数を数えることも含まれます。（このユニークな件数は、「異なり数」とも呼ばれます）

もし手元のデータに複数年の履歴があるようなデータであれば、年や月毎に人数の変化を見てみるのも有効な方法です。更に、組織別に人数を集計することで多くの情報を得ることができます。

これらは簡単な方法ですが、思わぬ発見やミスの回避につながることもあります。

また、複数のシステムからデータを集めてきて統合する場合、それぞれのデータテーブルの件数を数えてみるとずれが見えることもあります。

以上の議論はシステムから抽出したデータを念頭に置いたものですが、サーベイの場合も同様です。サーベイ結果に含まれる従業員数を数えつつ、回答率を把握することは初期分析の一歩目といえるでしょう。

2つ目のWho：システム

次に、手元にやってきたデータの抽出元であるシステムについての情報を集めます。Whoの観点でいうと、それぞれのシステムでどんな人を対象に管理しているのか、ざっと把握します。

人事部門に在籍している方からすると、人事システムを触る機会が多いわけですからこの問いに答えるのは簡単かもしれません。

前編で述べたように、人事データ分析で利用するシステムは多岐にわたります。改めて眺めてみましょう。

人事管理・給与管理プロセス

人事管理システム
給与管理システム
勤怠管理システム
出張旅費管理システム
総務事務またはワークフローシステム
採用管理システム
研修管理システム

社内サーベイ

エンゲージメントサーベイ用システム
社内サーベイ用システム（汎用）

健康管理・労働安全衛生

健康診断管理システム
ストレスチェックシステム

全社インフラ・コミュニケーション

KPI管理・伝達用ダッシュボード（BI）
IT端末のログ管理システム
社内コラボレーションツール（Microsoft 365, Google Workspaceなど）
組織開発関連システム（1on1支援など）

これらのシステムに登録されている従業員はすべて同一で、しかも全従業員がカバーされているという場合は、この調査は早々に終わります。

しかし、マルチベンダー・システムで構築されている場合、それぞれのシステムがカバーしている範囲が微妙にずれていることもあります。採用管理や研修管理のようにとある人事機能に特化したシステム・サービスの場合、必要性に応じた管理範囲となっていることもあるかもしれません。

また、システム機能の範囲とは異なる観点として、業務上の分担に起因し、各人事担当者が担当外のシステムの状況を把握していないということもあり得ます。給与や社保の計算をBPO（アウトソーシング）している場合も同様です。

このように、ひと口に「人事」といっても、各企業・団体で人事業務の分担とシステム構成には違いがあります。そのため、組織ではじめて本格的なデータ分析を行う場合や、外部から特定のピープルアナリティクスプロジェクトに参画した場合は、これらの点について確認するとよいでしょう。

最後に確認するときのポイントをあげておきます。

分析テーマに関連するシステムでは全従業員を管理しているか否か。
全従業員を管理していないシステムでは、どのような範囲をカバーしているのか。（雇用形態、役職や職位等の観点で把握する）
システムの運用期間において、カバー範囲に変更はなかったか。（運用3年目から管理対象を増やしたなど）
任意施策・任意登録による運用となっていないか。（希望があった方のみ利用する、回答必須でないサーベイなど）

なお、本セッションではデータの抽出元として人事関連システムやサーベイを想定して議論しました。もし、ピープルアナリティクスに特化したデータ基盤を整備されている場合は、データ基盤（データウェアハウスやデータレイク）がカバーしているデータを押さえることに該当します。

3つ目のWho：従業員と組織

最後は人と組織ということで、データの母集団そのものに焦点を当てます。端的に言うと、母集団（＝全従業員）はどのような人で構成されているのか？という問いに答えるというものです。

せっかくですので、みなさんも少し考えてみてください。
在籍している組織はどのような人で構成されているでしょうか。
あるいは、どんな人がいらっしゃるでしょうか？

これはとてもシンプルな問いで、人事部門に長く在籍されている方でしたら「そんなのわかっているよ」と思われるかもしれません。一方、言葉で表現するのは難しい感じた方もいらっしゃるかもしれませんね。

データ分析において、その母集団の属性や形を捉えておくことは常に大切です。

そして、人事データを分析する上では、その主たるターゲットである人と組織の外観を捉えることは極めて重要です。企業・団体によってその姿は異なるからです。

人事データ分析のテーマは多種多様でありますが、どのようなテーマであったとしても、人事としてマネジメントしている母集団の様子をデータから把握することからはじめるべきです。

私の場合、人事の基本属性に着目し、以下のような観点でデータを俯瞰してみることを実践しています。

従業員数をカウントする。
年齢構成を確認する。年齢分布、年代別のカウントで把握する。
性別構成を確認する。
組織の所属構成を確認する。また所属別の人数を把握する。
採用区分（新卒・中途）の構成を確認する。
グレードまたは職位・地位・役職別の構成を確認する。
雇用形態（正社員・嘱託など）の構成を確認する。
職種・ジョブの構成を確認する。
在籍年数の分布を確認する。
以上の観点を組織起点で集計し分布を確認する。

つねにこれらを確認できるとは限りませんが、これらを統計的に把握することで、以後の分析を円滑に行うことができます。また、この段階でデータ抽出上の問題を発見できることもあります。

さらに、これらの分析結果を共有することで分析チーム内で気づきを得られたり、ステークホルダー間の認識ギャップを埋めることにつながる場合もあります。

以上のように、データからその母集団の様子をできる限り捉えることは、データ分析者にとって大切です。多種多様な人たちが存在することを認識しつつ、分布的な視座をもって議論に臨むことができるようになるからです。

それでは、ここで取り上げた観点でデータを俯瞰するにはどうしたらよいのでしょうか？

もし、手元のデータが全従業員分のデータである、もしくは、一般従業員などセグメント内の全データである場合は、データを集計したり可視化するような記述的な分析手法を用いて把握することになります。

次回以降、記述的な分析にフォーカスし、従業員と組織を俯瞰する方法をお伝えしていきます。

まとめ

本レターでは、Whoという視点でデータの外観を捉えることをお伝えしました。

具体的には、「データ」「システム」「従業員」それぞれでどんな人が含まれているのか把握することが大切で、いずれも分析対象である人への理解を深めることがポイントになります。

次回より、データ母集団の外観を把握するための記述的分析の方法について、お伝えしていきます。

次回もお楽しみに！

データがやってきたら、まず何をやるべきか（後編）

3つの観点でWhoを考える

1つ目のWho：データ

2つ目のWho：システム

3つ目のWho：従業員と組織

まとめ

Written by 武田 邦敬

Written by 武田邦敬