選挙のオープンデータを作ったら、Facebook の新機能に採用された話

Hal Seki
Code for Japan
Published in
7 min readDec 5, 2017

Code for Japan の関です。Civic Tech Advent Calendar の4日目の記事です。(1日遅れてしまった。すみません。。)

まだ記憶に新しいかと思いますが、今年の10月に、第48回の衆議院議員総選挙が行われました。その時に候補者に関するオープンデータを作りましたので、その顛末を記事に残しておきたいと思います。

候補者のオープンデータを作った

今回、Code for Japan を始めとする有志で、衆議院選挙候補者に関するオープンデータと、それを検索するフロントサイトを作成しました。
https://kouhosha.info/
にて公開しています。

このサイト自体は、郵便番号などから自分の住む地域の選挙区及び候補者を探すことができるだけの単純なものですが、他のメディアのサイトと根本的に違うのは、我々は候補者のデータをオープンデータとして公開したという点です。
以下のように、候補者一覧及び小選挙区のデータをCC0ライセンスで公開しています。
https://kouhosha.info/data

(データのダウンロードページ)

また、同じデータを Wikidata という、オープンな構造化データベースにも登録しています。

データ収集のプロジェクト自体オープンに組織されており、データの作成には、10名近くのボランティアエンジニア、10名以上のデータ入力ボランティアが協力してくれました。以下が活動のGithubリポジトリです。
https://github.com/codeforjapan/codeforelection

また、このプロジェクトには、英国の NPO mySociety が協力、彼ら経由で海外でも利用されています。
例えば、フェイスブックの新機能で、自分が住んでいる選挙区の政治家をフォローできるようになったのですが、この機能に使われているデータは、Code for 選挙プロジェクトで作ったものです。(この機能のデータ提供欄はmySocietyとなっていますが、彼らが使っているデータは、Code for 選挙 プロジェクトで作ったデータです。)

(Facebookの機能)

文句を言うだけではなく、何か手を動かしたいと思った個人が立ち上げ、20名程のエンジニアやデータ整備ボランティアが集まり、オンラインのコミュニケーションを通じて全ての候補者のオープンデータを作り上げ、イギリスのNPOである mySociety と連携することでフェイスブックから使えるようになりました。

参考記事:衆院選の候補者情報をオープンデータに、有志プロジェクトが進行中:ITPro
http://itpro.nikkeibp.co.jp/atcl/news/17/101002423/

誰でも自由に使える候補者データというのは存在しない

今回、そもそもこのプロジェクトを始めようとしたきっかけは、政治的な偏りを排除し、それぞれの政治家の事実情報のみを積み上げた客観的なデータベースが欲しいと思ったことからでした。

(当時のフェイスブックへの書き込み)

9月29日にプロジェクトをスタートさせて、たくさんの仲間が集まったのですが、最初にびっくりしたのが、そもそも候補者の一覧というのが存在しないこと。
総務省の公告などから引っ張ってきたら見れるのかと思ったら、一覧のPDFでさえも入手出来なかったのです。
そこで、仕方なく各政党のHPなどからデータをクローリングして取ってくることとしました。

選挙区の区画データについては、幸いなことに、東京大学の西沢先生が整備してくれていたデータを使うことができました。

また、名前や政党などの情報だけでなく、フェイスブックやツイッターのアカウントも整理したかったので、それについては人海戦術で集めることにしました。
そこで大活躍したのがGoogle Spreadsheet。入力ボランティアに広く呼びかけて、必要なデータを埋めていきました。

(実際に使ったSpreadsheet)

そして、多くの人の手を借りて、なんとか公示日である10月10日にはデータを完成させ、Webサイトで配布を始めることができました。

今回データを作ってみて、ちゃんとしたデータを作るのはとにかく大変であることに気づきました。大手メディアは政党からExcel形式のデータを貰えるという話も聞きましたが、それにしてもデータの整形や確認作業などは発生しているはずです。それぞれのメディアが事実情報という本来全く差が出ない情報を収集するのに人手をかけているという無駄な状況には疑問を感じます。

国民の主権である選挙という重要な情報に対して、オープンなデータが存在しないというのもおかしな話です。選挙管理委員会には是非候補者データの公開を検討して欲しいものです。

イギリスでは候補者の過去の実績情報を調べられるサイトがある

私がそもそも選挙のデータを作りたいと思ったのにはお手本となるサイトがあります。それは、イギリスの TheyWorkForYou というサイトです。

mySociety が運営するこのサイトでは、自分の選挙区にある政治家が、いつどのような議会でどのような発言をして、どのような法案に賛成/反対をしているかを見ることができます。

(候補者のページ)

登録をしておくと、指定した政治家の活動に応じてお知らせを貰えたりもします。

選挙の時には、マニフェストや演説など、未来の事を聞いたり見たりして投票を行う人が多いと思います。でも、その議員がいままでどんな発言をし、どのような法案に賛成/反対をしてきたか、という客観的な情報はとても重要な判断材料になると思います。
(党議拘束がというものがあるので賛否情報に個人の意思が反映されにくい、という側面もあるので国会より地方議員の方が面白そうですが。)

ちなみに、mySociety は Popolo という政治家に関する標準データ形式を定義していて、近々 Code for 選挙からもこの形式のデータを配信するつもりです。

Code for 選挙プロジェクトも、TheyWorkForYou のようなサイトに進化していければなぁと思っています。

まずは、議会議事録のAPIと繋げるところからかなと。

駆け抜けるような1ヶ月でしたが、今回、技術的にも考え方的にもスペシャルな仲間が集まって、楽しくワイワイとやれたのも良かったです。この場を借りて、みんなにお礼を述べたいと思います。ありがとうございました!

今後の活動にJoinしたい人は、是非 info@code4japan.org までご連絡ください!

Originally published at Code for Japan.

--

--