オープンデータを流通させるには? Virtuoso ハンズオン(2017年8月5日)

Mitsugu INOUE
Stories by Code for Chiba
6 min readAug 7, 2017
Virtuosoハンズオン

Code for Chiba の井上です。

オープンデータは、オープンなライセンスでデータを公開をするっていうことなんですが、公開するだけではあまり意味がなく、使ってもらわないと価値が出ません。
そこで、利用しやすさを示す指標として「5つ星オープンデータ」という評価指標があります。

PDF,EXCEL,Word形式の課題
LOD/RDF形式の利点

詳細は「5つ星オープンデータ」で検索をすればたくさん出てきますが、簡単に言うと、
1.人が目でわかる電子化(PDF)
2.特定のコンピュータが分かる(EXCEL,WORD)
3.汎用的なコンピュータが分かる(CSV)
4.他のコンピュータから使える(RDF)
5.他のコンピュータのデータをつなぐ(LOD)
ということですが、4つ星以上は急に難易度が上がっているような気がしませんか?
CSVは、カンマ”,”で区切ったデータなので、ある程度ITリテラシーのある方ならば、EXCELで作成した表をCSV形式でエキスポートすれば作成できますし、テキストファイルとして目で見ることができますので、扱いやすいと言えます。
4つ星以上は、オープンデータを自身のデータだけでなく、他者のデータを関連付けたりするわけで、自データを利用いただいたり、他データを利用するための仕組みが入っています。関連付けるためのデータを含めた枠組みがRDF(Resource Description Framework)であり、今回はそれを勉強するための会なのです。勉強会の先生は新田清さん。大手インターネット企業の研究所に勤務しセマンティックWebを研究しています。

ハンズオンの目的

千葉市にはオープンデータポータルがありますが、この中を見ても、PDF、EXCELが多く、CSVがところどころあるくらいです。4年くらい前までは先進的だった千葉市のオープンデータポータルは現在では少々寂しい感じなので、これから盛り上げたいと思います。
さて、最初に申し上げますが今回のハンズオンは、中級者以上のエンジニア向けだったように思います。
実は開発現場から遠ざかっている私には、既についていけていません(汗)。今回のハンズオンはCfCの中でも技術レベルの高いメンバーが集まったと思います。

Virtuoso Open Source

まず、最初に「Virtuoso」とは。「ヴィルトゥオーソ」と発音をするらしく、もともと音楽の達人の意のようです。何度聞いても発音が難しい(笑)。
RDFは主語(Subject)、述語(Predicate)、目的語(Object)からなるグラフモデルで、3つの要素から成り立っているのでトリプルと呼んでいます。そしてこのVirtuosoはトリプルを格納(ストア)するものなので、トリプルストアと呼ばれソースが公開されています。
そしてこの RDFデータ専用のデータベースであるVirtuosoにアクセスするためには、SPARQL(スパークル)というクエリ言語を使います。

SPARQL概要
RDFトリプルとトリプルパターン

ハンズオンでは、AWS上にVirtuosoを起動し実際にSPARQLにてRDFを呼び出すまでを行いました。以下は実行結果で文字ばかりですが、実際に呼び出したのを目の当たりにするとやっぱり感動ものです。

SPARQLの実行結果

千葉市のオープンデータには、4つ星以上のものがなく、とりあえずは市の職員の方も扱いやすいCSV形式での提供をお願いしてきました。しかしながら世界には、LODクラウドと呼ばれるグラフが存在していて、やはりオープンデータがそれぞれリンクされており、さらに共通語彙基盤を用いれば日本全国の統一されたデータがボーダーなく利用できるという夢のような話も実現できるはずです。そんな希望と期待を感じて今回のハンズオンを終えることができました。

最後に発見をしたのですが、最近、京都市オープンデータポータルがDKAN( CMSのDrupalをベースに作られたデータポータルサイト)を用いて著しい進化を遂げています。
Virtuosoについて少し分かった私たちが京都市オープンデータポータルを見ていると・・・一番下にSPARQLのエンドポイントを発見することになりました。それも実装にVirtuosoを使っているではありませんか。
京都市が進んでいることを改めて知り、悔しさをバネに今後千葉市でもがんばることを新たに誓ったメンバーなのでした。

写真に向かって左側から2番目が新田さん、筆者の井上は3番目、4番目はCfC代表理事の浦本さん

--

--