研究不正とデジタル時代の考古学
小保方晴子によるSTAP論文の研究不正事件は記憶に新しいところだろう.研究不正の種類は無数にあるが,特に研究発表に関する不正は次の三つが挙げられる.
捏造とは,ありもしないことをあったと主張すること,改竄とは観測データを自分の都合の良いように加工すること,剽窃とは他人の発表を盗むことだ.
さて,小保方事件よりも大胆,というよりはあまりにも杜撰な研究不正事件が2000年に発覚したことを覚えておられる読者も多いことだろう.藤村新一による旧石器捏造事件である.彼は1970年代半ばから各地の遺跡で事前に埋めておいた石器を「発掘」し,仲間内から「ゴッドハンド(神の手)」と呼ばれていた.もちろんこれは捏造にあたる.この捏造事件を受けて,当時の考古学関係者は大変な騒動に巻き込まれていたように思う.シンポジウムがいくつも開かれていたし,僕もその一つに参加した.ただ,他の学術分野,例えば僕のメインフィールドである情報科学分野への影響は限定的だったように記憶している.
小保方事件が画期的だったのは,それが我が国のあらゆる学術分野に影響したことだ.特に彼女が弁護士を立てて「自分のしたことが研究不正にあたるとは知らなかった」「悪意(彼女は「悪意」を「自由意志」の意味ではなく「不正を働く意図」の意味で使っている)をもって捏造,改竄,剽窃を行なったわけではない」と主張したため,その後,あらゆる学術分野において「知らずにやっても不正は不正です」と文科省が通知を出したぐらいだ.
小保方事件のあと,僕は情報系の研究仲間と研究不正について話し合った.確かに僕たちの分野でも,被験者実験の結果をごまかすとか,動いていないシステムを動いているように見せかけるとか,そんな不正は出来なくはない.だが,最近の学会はシステムのデモの場を用意するのが普通なので,動いていないものを動いていると言い通すのはほとんど不可能だし,ジョブズが言った通り Real artists ship の精神で,本物のシステムは出荷される.(出荷されない本物もあるが,出荷されたものは本物である.)なので情報系で研究不正は起こりにくいのではないか,というのがその時の結論だった.
そんなことを考えていたのだが,最近ピラミッドのデジタルデータを見ていてふと旧石器捏造事件を思い出したのだ.
僕たちの手元には,エジプトのピラミッドのデジタルデータがある.これをレンダリングすればCG映像が出来るし,事実そうしている.我々のチームのCGアーティストは非常に優秀で,いつも映画クォリティの映像をレンダリングする.
もし,もしも,自説にあわせてCGのほうを,いじりたいという衝動が起こった場合,技術的には,僕たちにはそれができる.それが一般の人からはアクセスしづらいピラミッド内部に関する部分なら,捏造の発覚には時間がかかるだろう.事実,藤村新一は25年間捏造を隠し通したのだ.
以上は極端な例だが,ノイズ除去過程の過失(バグ)で元データに存在しない情報を付加してしまう,あるいは元データにあった情報を消し去ってしまうことは当然あるだろうし,それに基づいて考古学者が誤った仮説を立ててしまうかもしれない.
実験科学の分野では実験ノートが実験の真正性を担保するし,専用の実験ノートも市販されている.(考古学者向けにフィールドノートサイズのものがあればいいなと思う.)しかしながら,一般的に大量のデータを超高速に処理し,それを例えば1時間に50回とかのペースで試行錯誤する情報系研究者の場合,実験ノートの使用はまったく現実的ではない.
そこで僕たちは,全ての生データ,加工に使ったプログラム,ドキュメント,ビルドスクリプトなどをすべてバージョン管理した上でGitHubに残すことにした.リポジトリを辿れば,生データも,試行錯誤の過程も,タイムスタンプ付きですべて見ることができる.データの性質上,プライベートに設定しているリポジトリがほとんどではあるが,必要があれば秘密保持契約(NDA)を結んだ上で開示することはできる.
完璧を期すならGitではなくMercurialを使うとか,GitHubではなくブロックチェーンに流すとか,まだまだ上はあるが,ひとまずはこれで良かろうと僕個人は思っている.
ところで,こういう履歴データを残して置くには永続的に金がかかる.文科省は研究不正防止のガイドライン作成に金をつぎ込んでいるが,こうした研究者のちょっとした工夫にも永続的に金を払う仕組みを考えてはどうだろう.
(ちなみに僕は,科研費などの助成金を取得すると受講させられる CITI Japan 研究者行動規範教育プロジェクトの教材作成に関わっていて,その対価も受け取っている.GitHubの使用料半年分程度ではあるが.)
PS. この記事は Ulysses for Mac で書いた.