STAP問題で明らかになった科学評価システムの制度疲労 (中)形骸化してきているNatureら有名雑誌の論文査読システム

STAP論文のおかげで皮肉的な事実が垣間見えた。それは、論文の科学的妥当性を判断するのが目的のはずの査読が、Natureが求めるような「多角的に研究された論文」(=多くの機械をつかって色々なデータを揃えている論文)の検証にたいして役に立っていないことだ。
|

STAP論文のおかげで皮肉的な事実が垣間見えた。それは、論文の科学的妥当性を判断するのが目的のはずの査読が、Natureが求めるような「多角的に研究された論文」(=多くの機械をつかって色々なデータを揃えている論文)の検証にたいして役に立っていないことだ。さらに深刻なことだが、せっかく高額の先端機器を使って集められたデータがただの飾りにしかなっておらず、論文が主張している仮説の検証に全く寄与していないということだ。

STAP問題で、ネット上での検証作業が論文の査読に勝る可能性が提示されたのは重要だ。Knoepfler博士のブログが様々な生物学的問題点を指摘した。また十一次元を名乗る方により画像データの問題点が報告された。ブログ「kahoの日記」は、論文のシークエンス・データ(核酸配列を読んだデータ) を直接解析すると、色々矛盾点が見つかることを指摘した。たとえば、新規に作られたという論文のSTAP細胞と通常実験室でよく用いられているES細胞がシークエンスデータ上はありえないほど非常に似通っていたそうだ。

多分、忙しい研究者であるSTAP論文の査読者にはこうした問題点を追求できる余裕がなかったのだろう。(だが上記のひとたちも恐らく忙しい研究者だ)

しかしひょっとすると、技術が複雑化したために、Natureが通常揃えるような3、4人程度の、分野で実績のある研究者(=たいてい年を取っていて、実際には先端技術についていけていないひとたち)と幾人かの専門の編集者たちだけでは今時の論文を検証しきれないのかもしれない。

Natureは「多角的研究で検証された、インパクトがある美しいストーリーをもった論文」を求める。この姿勢は、間違いなく、確認バイアス(=つい仮説に合う証拠だけよりすぐってしまうという人間のさが)を助長する。技術が進歩して、そういう一見仮説と合っているデータを集めることが(どんなに仮説が間違っていても)可能になる事態が増えている。

そもそも、仮説に反するデータを提示することはNatureのような雑誌に載せる上では大抵負にしか働かない。矛盾するデータは隠し、複雑なデータだけ載せてお茶を濁す論文が横行する。最新機器を使ったデータをただの飾りとして用いているので、論文の実質はよりいっそう空虚になる。査読・編集の側からいうと、こうしたデータの不適切な提示は、論文の仮説検証の深度を見極めるための障害にすらなっている。最近こういう問題を抱えた論文が、世界的に著明な研究室から有名雑誌に多数掲載されている。そして、われわれ科学者はその裏を想像しながら論文を読まなければならないという、実に馬鹿げた事態が生じている。

特に日本では実際に論文を書いている教授(シニアの連絡著者[コレスポンディングオーサー])が往々にして実験・データ解析に全く関わっていないために、この問題が深刻化する。日本は、世界的に見て豊富な予算を科学に投資している一方で、団塊世代の教授たちが職に居座っていることで世代交代が進まず、若者の雇用問題も絡んでシニア・ジュニアの乖離が進んでいる。この日本でSTAP問題が起きたのは、ある意味必然だったのかもしれない。

STAP問題のおかげで、論文の出版後のネット上での議論をより重視する姿勢が正しいことが裏付けられた。さらには、論文の査読過程を公開する雑誌も珍しくなくなって来ている。今回のSTAP論文では、それを望む者も多いようだ。こうした試みでは、PLOSやF1000、BMCなどが先駆的であるが、この動きは今後強まるだろう。科学の評価のあり方が変化しつつある。

(2014年4月20日「小野昌弘のブログ」より転載)