ウォークインサイト(実例編)

一体どの数字が正しいのか?-大きく異なるデモ参加者数の報道-

Photo by RolandWillaert

前回の記事では、イベント参加者数などの集計について、既存の方法と新手法であるWi-Fiによる人数カウントの技術的な仕組みと推計のロジックをお伝えした。

今回は、「ウォークインサイト」を実際に大規模の人数推定に活用した事例を紹介するが、その前に今ホットな彼が提供してくれた話題を少々見てみよう。


2017年1月20日(日本時間21日)にアメリカ連邦議会議事堂で開かれた式典で宣誓し、トランプ氏が第45代大統領に就任した。就任前から注目を浴びていた通り、その就任式の規模についても色々と物議を醸している。

ABCニュースによると、2009年のオバマ大統領就任式には約180万人が、2013年には約100万人が集まった。ワシントンD.C.の関係者はこれまで、今回の就任式の聴衆を、70〜90万人と推測していた。
ナショナルモール周辺では、車両規制が行われており、就任式会場へのメインのアクセス手段は地下鉄となっている。ワシントンメトロのツイートによると、この日の午前11時の時点での利用者は19万3000人。2009年の51万3000人、2013年の31万7000人と比べても少なかった。

一方、当の本人のこのように発言している。

米中央情報局(CIA)本部を訪れたトランプ氏は職員らを前に「演説の最中に見たところ(聴衆は)100万、150万人はいた」と語り、「(メディアは)ほとんど誰もいなかった場所を見せてドナルド・トランプはあまり人を集めなかったなどと伝えた」と付け加えた。
また、ある報道機関が聴衆は約25万人だったと推計したことについて「そこまで悪くなかった。それ(報道内容)はうそだ」と述べ、演説を行った連邦議会議事堂前の階段から20ブロック先のワシントン記念塔(Washington Monument)まで人で埋め尽くされていたと主張した。

政治家と聴衆は切っても切り離せない。自らの影響力、求心力のバロメーターとして機能するからである。そして、それは支持を集めている時だけではなく、不支持の場合でも同じように機能してしまう。だからこそ、その規模の推計が報道の対象となり関心が寄せられる。


26万人か? 100万人か? 韓国デモでの論争

韓国での大統領退陣要求デモは2016年10月末から始まった。1次集会時に大きな差がなかった警察発表と主催者発表の参加者数は、2次集会から警察発表の4万8千人に対し主催者発表は20万人となり、15万人以上の差が生じる結果となった。

さらに11月12日に行われた3回目の集会では、警察側発表では26万人に対し主催者側発表が100万人となり、いよいよ参加人数への疑問は韓国国内で大きな関心事となっていったのである。

そんな中、韓国のスタートアップであるZOYI(ゾイ)は「ウォークインサイト」でこの問題を科学的に解決しようと名乗りをあげた。

私達は「もしかしたら、我々が持っている技術を使用して、もう少し正確で科学的な人員推定が行えるのではないか」と考えました。もし可能であるなら、私達がウォークインサイトを通して企業の意思決定に貢献しているように、社会でもより良い議論が行われるように微力ながら貢献することができないだろうかと考えました。
勇気を出して、すべての国民が関心を持つ敏感なテーマに挑戦することを決めた後、私達はいくつかの基準を決めました。
まず、本プロジェクトは技術の社会貢献であり情報の共有を目的としていること。
第二に、社会現象の科学的な観察を目的に行われ、さまざまな理由によりデータの品質が期待に及ばない場合は実験の失敗と定義し、そのデータは活用しないこと。
第三に、徹底的に政治的に中立的な立場に基づいて行うこと。

「ウォークインサイト」①取得範囲と測定エリア

Wi-Fiセンサーによる取得範囲

現在一般的な規格では、Wi-Fiの最大電波到達距離は半径100メートル程度とされている。しかし、この値は見通しが良く障害物が無い状態が前提とされているため、Wi-Fi機器が実際に設置される箇所を想定すると半径数十メートル程度が実際の値となることが多い。

ウォークインサイトも見通しの良い状況では上記規格に近い値が出ることもあるが、主な導入先が小売店舗や商業施設であるため最大測定可能範囲は半径約50メートルとしている。

ちなみにWi-Fiセンサーを提供している企業は複数あるが、最小測定範囲こそセンサーの設計や性能によって異なるものの、最大測定範囲は前述の通り規格値が上限となるはずである。

測定スポットの選定

センサーの最大測定可能範囲が半径約50メートルのため、今回はエリア全体をカバーするのではなく、参加者がデモエリアに入る入口となる地点を中心に測定することがより効率的であると判断し測定地域を設定。過去の集会時の流動人口の流れと主催者側が発表した移動計画等を考慮し、合計53個のスポットを選定した。

「ウォークインサイト」②センサー準備と設置

電源確保

通常の店舗内への設置イメージ

センサーが作動するためには、なにより電源が必要となる。本来店舗で運用する際にはセンサーを店舗内の電源に接続するが、今回の集会の場合は屋外スペースを測定する必要があったため、センサーに10時間以上電源を安定的に供給することができる市販の大型バッテリーパックと組み合わせスタッフが携帯した。

センサーはWi-Fiの信号を検出するように設計されているため、信号が透過しにくい金属あるいは水が近くにある場合は、信号が弱くなることがある。バッテリーパックは金属素材のため、図のようにセンサー側を外側に向け、かつ人体(約70%が水分)からもなるべく離すように収納した。

センサーとバッテリーが収納されたバックパックを背負ったスタッフは53地点に散らばり、午後2時から午後9時20分まで各地点で収集したデータはデータサイエンティストの元に集められ分析が行われた。その結果、明らかになった事実は以下の通りである。


人数:「ウォークインサイト」を用いた推計人数は73.8万人!

推計方法

午後2時から午後9時までのセンサーに感知された信号に基づいて分析を行った結果、重複を除いた累積人員は約73.8万人と推定された。

  1. デバイス数
    11月19日午後2時から午後9時20分までに合計295,498個のランダム化(※)されていないデバイスが検出された。
    ※スマートフォンが通信を行う際、特定環境下において同一端末であっても別の端末固有値を発信することがある。これをランダム化と呼んでいる。別途記事を作成予定。
  2. Wi-Fiオン率、ランダム化率
    Wi-Fiのオン率を一般的とされる50%、ランダム化率はデモ当日の時点ではより詳細な検証を行う時間が無かったため、20%と仮定。
    (後日、デモエリア付近のウォークインサイトが設置されている店舗のランダム化率を計算したところ約18.9%と算出され、仮定したランダム化率と大きな差がないことを確認。)

以上より、当日Wi-Fiがオンのデバイス数を約369,372個(295,498 /(1–0.2))と推定。その値にWi-Fiのオン率を適用し、Wi-Fiをオンしないデバイス数を含め反映した結果、デモエリアを訪れた人数は約738,744人(369,372 / 0.5)と推定された。

時間帯別:午後4時〜5時の人数の増加幅が最も大きく、ピークタイムは午後7時〜8時

デモエリアの人数を時間帯別に見てみると、午後4時〜5時の時間帯が最も高い増加率(26%)を記録し、ピークの時間帯は午後7時〜8時で約22.7万人がいたと推定される。午後6時以降は増加率が落ち着き、流動人口に大きな変化はなかった。

移動:時間経過につれて光化門方向に人数が増加

時間帯別に各スポットをビジュアル化 http://spot.zoyi.co/result/

センサーの位置別に主要時間帯別のデモエリアの人数変化を可視化したものが上図である。午後2時では全体的に特定の場所に人数が偏ることはなくまばらな状態だったものが、午後3時になると人数が急増、午後4時からは車両の通行制限が開始された時点より光化門広場付近の人が多くなっている様子が伺える。本格的にデモが始まった午後6時には光化門広場以外にも多くの人々がいるが、夜9時半には大統領府への行進のため広場へ向かって人々が多くなる様子を確認することができる。

滞在:平均約80分。早く来た人ほど、長く滞在。

デモエリアに留まっていた人々の平均滞在時間は約80分で、1時間未満の滞在者が53%と最も多く、1時間以上2時間未満の滞在者は21%だった。つまり、2時間未満の参加者が74%と大きな比重を占めていた。

また、滞在時間ごとにデモエリアに現れた時間帯を確認してみたところ、長時間滞在者ほど集会の現場に早く現れる傾向にあった。

1時間以上2時間未満の滞在者は本格的に集会が始まる夕方6時〜7時にデモエリアに最も多く現れ、2時間以上3時間未満の滞在者は午後5時〜6時、3時間以上4時間未満の滞在者は午後4時〜5時、4時間以上の長期滞在者は午後2時〜3時までの間に最も多く現れた。


今回の分析の限界

今回、ZOYIが調査に乗り出すとリリースをした後に「通常の流動人口を除き、デモ参加者のみ推定することができるかどうか」についての質問が多く寄せられた。ZOYIはそれについて、こう見解を述べている。

統計的には、i)集会前の平均流動人口を知ることができれば増減を反映して集会参加者数を推定したり、ii)集会スペースを限定して滞在時間を測定し、通過している流動人口を除外する方法などがあります。
今回の分析がスポット的に進行されたため、最初の方法は既存のデータがないため比較しにくいことが分かりました。ただし、集会現場付近の店舗の流動人口を通してトレンドを確認することができました。光化門の交差点(A店)と鐘閣交差点(B店)にある2店を対象に流動人口を確認してみたところ、A店は、通常の週末(10月)に比べの流動人口が126%も増加しており、B店も32%が増加していたため、集会のために光化門一帯の流動人口が大幅に増加したことを確認することができました。また、前の週の週末(12日)に比べA店は12%、B店は24%の減少を示し、前の週の集会に比べ人員が減少したことを確認することができました。
第二の方法は、すべての領域をカバーすることができませんので滞留時間の測定に困難がありました。一般的な店舗での設置時は死角がないように、センサーの配置と測定を通して信号の偏りがないように1つのデバイスからの信号を長くシームレスに継続把握できるようにします。「事前のプロセス — 設置時に技術サポートチームが、センサーごとの信号強度を測定 — 設置後の一定期間の集中監視」が光化門の集会現場集計では、まさに当日行われたプロジェクトであり、広範な地域を53個という限定的なセンサーを持って測定するとどうしても死角が発生してしまい、それによる滞留時間の把握に限界がありました(滞在時間の分析は、無線信号が二回以上特定された人員を対象にのみ行われました)。

おわりに

ウォークインサイト」は小売店舗や商業施設の顧客流動や動線分析のソリューションとして開発されたが、今回はそれを社会貢献の一部として国民的関心事であるデモの分析に活用した事例をご紹介した。

推計された73.8万人という数字は、警察発表の26万人と主催者側発表の100万人のほぼ中間ではあるが、双方の手法では辿り着けなかった数字である。そして、その事実はもとより「実際に収集されたデータ」がその根拠となっていることは非常に意義深い。

「経験」や「勘」というものも、突き詰めれば過去の傾向や事実に基づいていることは往往にして知られている。新しい技術や手法は必ずしもそれらを否定するために存在しているのではなく、同じ目的を達成するためにより精度高く、かつ容易に行うために生み出されていることも多い。

我々はこれからも、それがどのようなものを明らかにでき、そして、その先にどのような価値があるのかを伝える架け橋になっていきたいと思う。