Database Journal Club

Taro L. Saito
Database Journal Club
5 min readJan 17, 2018

--

2017年に新しく始めたことの1つに「Database Journal Club」があります。きっかけは、理化研の二階堂さんのこの記事。Google+を活用して、最新の論文のキャッチアップに役立てているとのこと。

研究者をしていたころは1日に数本、年単位で数百本論文を読むのは珍しくなかったのですが、エンジニアとしてコードを書くのが中心の生活になると、研究レベル(≒まだプロダクトとして使うには課題が残っている)のものをそのまま使うことはまずないので、次第に論文を読む量が減っていきました。

今でも論文を読むことそのものは大変ではないし、必要に応じて100本近くサーベイしたりしますが、アカデミアから離れて一番大変だったことは、ワーキングメモリの中に論文リストがなくなってしまうことでした。過去に読んだ論文が思い出せない、研究コミュニティでホットな話題は?など。頭の中にそういった情報の引き出しがないことでの弊害を次第に実感するようになりました。

例えば、新しい課題に取り組む際に、どのラボのどの研究者がどのようなテーマとして研究しているか知っていると、問題の位置づけや考え方の基盤、共通用語を確立できるので、プロジェクトの動機付け、問題解決の方針が立てやすくなります。分野のキーワードを知っているだけでも、関連研究を調べるのが容易になるのですが、常日頃から論文などを通して情報のインプットがないと、相対的に自分の仕事を位置付けるのが難しくなるのです。

もう少し具体例な話をすると、例えばストリームデータ処理(stream processing)について調べると、以下のリストにあるような論文が見つかると思います。このとき、iterative processing, materialized view, incremental processing, lambda architectureなど分野の用語を知らないと、サーベイすらままなりません。

ただし論文リストをこのような形で整理するのは、あまり簡単な作業ではありません。普段から論文を読むわけではないけれど、定期的にキャッチアップしたい、もう少し気軽に論文メモを残せる道具はないかということで、だれでも気楽に参加できるDatabase Journal Clubコミュニティを作りました。

データベースの研究コミュニティでは、SIGMOD, VLDB, USENIX系のカンファレンスが重要なのでそのあたりを中心に抑えておき、accepted papersのリストが公開されるとpaper listsカテゴリとしてポストするようにしています。その他、分散システムの開発に関連する研究、過去の論文でもデータベース実装技術として重要なものを気になったらポストしていきます。あとで社内で読むと面白いのではないかと思う論文は「TO READ」カテゴリに、DBMSについて学ぶのに良い教材などは「Learning DBMS」カテゴリに分類しています。また、活躍している研究者リストを「Researcher Index」カテゴリで紹介しています。例えば、このグループの研究だからこういう方向性で進めたいのだな、とわかるようになると分野の見通しがよくなります。

Google+をツールとして使って良かった点は、

  • URLを気楽にポストしやすい
  • メンバー管理がGoogle任せなので容易
  • スクロールで記事を探しやすい

困難な点は、

・リスト形式で整理されないので、あとでまとめて関連研究を抑えるための論文リストとして機能しない。

・論文PDFにたどり着くまでのステップが長い。Google Scholarへのリンクにするか、ACMへのリンク(会員しか読めない)にするかが悩ましい。

ここに挙げたようにまだいくつか課題があります。考え方の基盤を作るという目的のためには、論文の要約、面白い点、問題点を書きやすくする、トピックごとにリスト化するなどの工夫が必要だなと感じています。GitHubと併用すると良いのかもしれません。

Database Journal Clubは参加自由のコミュニティで、データベース業界の最新情報をキャッチアップしたい方の協力、アイデアを募集しております。

参考:似た様なコミュニティに、Papers We Loveなどもあります。こちらはComputer Science全体をターゲットにしているため、より多くの人が興味をもっているようです。

--

--

Taro L. Saito
Database Journal Club

Ph.D., researcher and software engineer, pursuing database technologies for everyone http://xerial.org/leo