「プロ直伝 伝わるデータ・ビジュアル術 ――Excelだけでは作れないデータ可視化レシピ」

実務者向けデータ可視化に関する書籍出版のお知らせ

Keiichiro Ono
Apr 11 · 8 min read

はじめに

この度、データ分析や可視化の各分野の専門家が集まって、技術評論社から本を出版します。私も、一章参加させていただきました。ここでは、この本がどのような方を対象とし、どのようなことを目指しているのかを紹介したいと思います。

想定読者

本書では、以下のような方々を想定読者としています。

  • Excelは使えるが、それだけでは上手く可視化できないデータがある人
  • 最近の可視化ツールにはどのようなものがあるのかを知りたい人
  • プログラミングは未経験、もしくは得意ではないが、計算表ソフトの機能を超えた可視化を模索している人

しかしながら、本書の内容を試すのに、計算表ソフトが使えることを前提とはしていません。バラエティに富んだデータと多数のアプリケーションをカバーしていますので、最近の可視化アプリケーションのユースケースを含んだカタログ的に読んでいただけます。本文中にある手順に従い、実際に手を動かして試すこともできるのですが、ざっと全体を眺めて、「最近のツールではこんなことができるのか」と気軽に読んでいただくことも可能な作りになっています。つまり端的に言えば、Excelなどでグラフを作ることを中心とした入門書と、D3やJupyter Notebookなどのデータサイエンティスト・エンジニア向けツールについて書かれている書籍の間にあるギャップを埋めるようなポジションを想定しています。

扱う内容

本書では、以下のアプリケーションを実例とともに紹介しています。

統計グラフ

  • Tableau 東 健二郎(京都府庁)
  • Power BI Desktop 小林 寿(CCCマーケティング)
  • Gapminder 河原 弘宜(コンサルティング会社)

地図

  • Excel&Bingマップ 小林 寿(CCCマーケティング)
  • ArcGIS Online 布川 悠介(スマートドライブ)
  • QGIS 朝日 孝輔(MIERUNE)

インフォグラフィック

  • E2D3 中根 秀樹(新聞社)
  • Infogram 荻原 和樹(東洋経済新報社)

ネットワーク

  • Cytoscape 大野 圭一朗(カリフォルニア大学)
  • Gephi 本田 直樹(京都大学)

Webツール

  • RESAS 松岡 和彦(阿佐ヶ谷美術専門学校)
  • IHME 小野 恵子(国際基督教大学)

監修:五十嵐 康伸(パーソルキャリア)

地図やネットワーク、インフォグラフィックといったものはなかなか計算表ソフトでは扱いづらいものですから、本書で取り上げているような専用のアプリケーションを使って作業するのが効率的です。また、各章を担当している執筆陣は、扱われているデータやツールの専門家です。

ネットワークの可視化

筆者によるCytoscapeで作成したネットワーク図の例

ここからは、私が担当しましたネットワーク可視化の部分についての概要と、本文ではカバーしきれなかった点も含めて紹介します。

本の中では、ネットワークを可視化する際に最低限必要になる用語などの知識と、可視化手法の紹介、そして二つのソフトウェア/実例による実際の作業の紹介をしています。詳しくは本書をご覧になっていただきたいのですが、今回は、小さなネットワークを手作業できちんとレイアウトするというよりは、大きめのネットワークを可視化の方針(何を見せたいのか?)に基づき、全体の傾向が見られるような図に仕上げる、というスタンスで書かれています。上記の図は私が以前作成したものですが、このような可視化は細部が見られない代わりに、どのくらいの数の部分構造(サブネットワーク、クラスター、サブモジュールなど様々な呼び名があります)が存在するのかがざっと見られます。こういったネットワークの全体像をテーマに沿って可視化する知識があれば、そこから詳細図を作り出すのは難しくないため、本書の内容を理解できれば、その応用でさまざまな図を作成できると思います。

本文中で使われているツール

ネットワークを可視化する場合、現在広く使われているツールには二つあります。それは、CytoscapeGephiです。両者ともJavaというプログラミング言語で書かれた非常によく似たデスクトップ・アプリケーションですが、細かい点を見ていくとそれぞれ特徴があることがわかります。本書では、どちらのツールに関しても実例を用いて紹介しています。

Gephiの特徴
GephiはCytoscape よりも後発ですが、特にソーシャルネットワーク解析などの分野で広く可視化に用いられています。Gephiの特徴には以下のようなものがあります。

  • ネットワークを読み込むと、そのトポロジー(ノードとエッジの接続状況)によって各種統計値を計算し、それを見た目に反映してくれる
  • 細かいマッピングを指定しなくても、それなりに見栄えの良いネットワーク図が手早く作成できる
  • ソーシャルネットワーク分析などでよく利用されるため、このツールの利用例を探しやすい
  • サイエンス以外の分野での実例が豊富
gephi.orgより

Cytoscapeの特徴
一方、Cytoscapeには以下のような特徴があります。

Cytoscape 3.7.1の初期画面
  • 科学、特に生物学分野では事実上の標準になっている
  • yWorks社のレイアウトアルゴリズムを含む、非常に多くのプラグインが存在する
  • CyRESTと呼ばれるREST APIを用いて、Python/Rなどの外部ツールからほぼ全ての機能を利用できる(自動化)
  • Cytoscape.jsとの連携が考慮されており、ウェブへインタラクティブなグラフィックスとして公開しやすい
  • 専業の開発者による新機能の開発が継続的に行われている
東京の路線図データからCytoscapeで筆者が作成したものを、Cytoscape.jsを用いてウェブでインタラクティブに見られるように書き出した例

両者をどう使い分けるか?

この二つのツールの使い分けですが、正直なところ、基本的な部分に関してはほぼ同等の機能を持っていますので、皆さんの好みで選んでいただいて構わないと思います。私がCytoscapeの開発に直接関わっていることもあってどうしてもバイアスがありますが、現状では、

  • 比較的少ない属性情報に基づいて、サクッと見栄えのするネットワーク図を作る場合はGephi
  • 大量の情報をオーバーレイして、複雑なネットワーク図をマッピングも含めて一から作る、もしくはPython/RでJupyter Notebookからコントロールする場合はCytoscape

といった住み分けが可能かと思います。Cytoscapeでは可視化の基本的な方針は全てユーザーに委ねられているのに対し、Gephiはよくある可視化のパターンをできるだけ少ない手順で実行できるように設計されています。本書の中にある両者の例を試していただくと、どちらが自分にとって使いやすいのかがわかると思います。

まとめ

本書のネットワークの章に関して質問などありましたら、Twitterでメンションしていただければお答えできるかと思います。

他の章も、現役で可視化の実務に携わっておられる方の興味深い例が収録されていますので、ぜひ一度書店にて手に取ってみてください。

よろしくお願いいたします。

Keiichiro Ono

Written by

Research Associate/Software Engineer/Cytoscape Core Developer at UCSD. Data Visualization Japan Organizer. #visualization #bioinformatics #dataviz

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade