AI生成の「ペーパーミル」を投稿した場合、確認されれば1年間の投稿禁止となる。
今後の投稿は、arXiv に戻る前にまず査読を通過しなければならない。
これは、arXiv のコンピュータサイエンス部門の委員長であるThomas Dietterichが X で発表した新ルールで、率直かつ明確で、例外はない。
論文に、著者が確認しなかった LLM 生成コンテンツが含まれていることが決定的に示された場合、記載されている全著者がまとめて処分され、例外はない。
このニュースが出るやいなや、Terence Tao もすぐに自身の見解を示した。
数学界で最も活発な AI 支持者の一人である彼は Mastodon に投稿し、以前の講演で提示した4項目の枠組みをこの新方針に当てはめたうえで、次の一文に要約した。
論文を生成するほうが、それを咀嚼するよりはるかに簡単な時代なのだから、これは正しい方向だ。
ネットは即座に大きな反応を見せた。もっと早くこうすべきだったと称賛する声もあった。
一方で反発もあった。2005年にインターネットを使って研究した論文も禁止するのか、というわけだ。
さらに、こうした連帯責任は、共著者全員がすべての引用を確認しなければならないということか、という懸念も出た。
arXiv の最も厳しい新ルール:署名した以上、責任を負う
物理学、数学、コンピュータサイエンスでは、ほとんどの論文はまず arXiv にプレプリントとして掲載され、その後に査読へ進む。
arXiv は世界の学術コミュニケーションにおいて最重要インフラの一つであり、現在はコーネル大学から独立した非営利組織として分離されつつある。これにより、より多くの資源と、ガバナンス面で先手を打てる自由を得られる可能性がある。
arXiv の新方針を一言で言えば、内容がどう生成されたかにかかわらず、署名した以上は責任を負う、ということだ。
Dietterich は次のように述べている。
生成 AI ツールが、不適切な表現、盗用された内容、偏った内容、誤り、誤った引用、あるいは誤解を招く内容を生み出し、それらが学術研究に組み込まれた場合、その責任はすべての著者にあります。
この種の行為に対する処分基準について、私たちは最近、明確化しました。
なお、新方針は AI を禁止するものではない。文章の推敲や文献検索の補助に AI を使うのは問題ない。
arXiv が線引きしているのは別の点だ。その論文に、自分の名前を載せるだけの確認を本当にしたのか、ということだ。
では「決定的な証拠」とは何を指すのか。Dietterich は典型例をいくつか挙げている。
存在しない論文への参照、いわゆる幻覚による引用。
原稿中に残った LLM のメタコメント。たとえば「これは200語の要約です。修正したほうがよいですか?」といった文だ。
埋められていないプレースホルダー。たとえば、「ここを実験データに差し替えてください」と残った表のままだ。
正式に投稿された論文にこうした基本的なミスが残っているなら、著者が自分の仕事をきちんと確認していなかったとしか考えられない。
こうした証拠が見つかった時点で、その論文全体の信頼性も疑わしい。
確認されれば、処分は arXiv での1年間の投稿禁止となる。禁止期間が終わった後も、新規投稿はまず正式な学術誌の査読を通過しなければ arXiv に載せられない。
しかも、その処分は連帯責任だ。記載されている全著者がまとめて処分される。
Dietterich はこれを「一発退場」の方針だと説明しているが、著者は異議申し立てを行うことはできる。
内部では、まずモデレーターが問題を記録し、該当するセクションの委員長が確認したうえで、はじめて処分が下される。
言うまでもなく、arXiv はここで比較的低レベルなミスを罰しているわけだが、それでも対応はかなり厳しい。
Terence Tao も賛同:論文を生成するのは、咀嚼するよりはるかに簡単
この新方針は大きな注目を集め、Terence Tao も自ら見解を述べた。
彼は Mastodon で連続投稿し、以前の講演で提示した4つの提言を枠組みとして、arXiv の新方針を一つずつ評価した。
その4つの提言は以下のとおりだ。
- 伝統的なワークフローにおける AI 支援の許容範囲を明確に定め、厳格に運用すること。
- 「最初に出版すること」や「問題を解くこと」への比重を下げ、代わりに「結果を咀嚼すること」を重視すること。
- AI に大きく依存する投稿者にも、真の学術的価値を生み出せるよう新しい課題設計を行うこと。
- 伝統的か非伝統的かを問わず、プロジェクトの目的――明示的なものも暗黙的なものも――と、その理由を明確に示すこと。
彼の総評は、新方針は最初の2項目と非常によく合致している、というものだった。
arXiv が今回引いた責任の境界線は、まさに提言1を実務として実装したものであり、AI 支援が許容範囲内であるとは何かを明確に定義している。
また、その方針の背後にある論理は、提言2の核心と直接一致している。
彼が重要な点として指摘したのは、現代では論文を生成することは、論文を咀嚼することよりはるかに簡単だということだ。
したがって、従来の学術制度の重心を咀嚼へ戻そうとする動きは、歓迎すべきものだという。
提言3について Tao は、すでに自然な受け皿があると述べた。
viXra のようなプラットフォームは AI 支援投稿にほとんど制限を設けておらず、咀嚼されていない内容の独立したアーカイブとして機能し得る。
ただし彼は、その性格づけも明確にした。そうしたプラットフォームは「生産」に重点を置くものであり、主流の学術引用の連鎖の一部として扱うべきではないし、arXiv の論文や学術誌論文の参考文献に載せるべきでもない、というのだ。
要するに、AI で大量に論文を作りたいならその受け皿はある。しかし、正規の学術システムに入れると思ってはいけない、ということだ。
もっとも、彼の投稿に対するあるコメントでは、その「受け皿」すでに封じられていると指摘された。
viXra 自体が現在は AI 生成論文を禁止しており、そのための別サイトとして ai.viXra.org を設けているという。
提言4は、より根本的な問いを投げかけている。プレプリント・プラットフォームは、いったい誰のためにあるのか、ということだ。
Tao の見方では、著者と読者のニーズは相互依存的であり、両方に応える必要がある。
彼はこう述べている。
著者だけに奉仕するプラットフォームは、読者が読みたがらない低品質な投稿であふれてしまう。読者だけに奉仕するプラットフォームは、著者に面倒な投稿手続きを踏ませる意欲を失わせる。
論文を生成する力と、論文を理解する力との間に新たな不均衡が生まれた以上、今後は品質基準を引き上げる必要がある――ただし最終的には、それは双方にとって利益のある変化になる。