より安全で透明性の高い AI エコシステムに向けたコンテンツ来歴の強化

Content Credentials、SynthID、そして公開向け検証ツールの早期版を通じて、AI 生成コンテンツの出どころを人々が理解できるよう支援します。

人々は日々 OpenAI のツールを使って画像や音声を生成・編集し、より表現豊かで、より便利で、よりアクセスしやすいコミュニケーションを実現しています。こうしたツールが、人々がものを作り、想像し、共有する方法の一部になるにつれ、それらのメディアがどこから来たのかを人々が理解し、検証できることが重要になります。そうすることで、より確かな自信を持って内容を解釈できるようになるからです。来歴シグナルは、コンテンツがどこから来たのか、どのように生成・編集されたのか、そしてその内容が主張どおりのものかどうかについて、文脈を与えることで役立ちます。

本日、私たちは信頼を築くための階層的かつエコシステム主導のモデルを通じて、コンテンツ来歴への取り組みをさらに強化します。C2PA への準拠を通じて、他のツールやプラットフォームが当社の来歴シグナルをより認識しやすくし、Google との協業により画像に永続的でクロスプラットフォームな SynthID ウォーターマークを追加し、さらに、画像が OpenAI 由来かどうかを人々が検証できる公開ツールのプレビュー版を共有します。

これらの更新は、これまでの取り組みを土台とし、オープンスタンダードを支援し、OpenAI 生成コンテンツの識別を容易にし、より信頼できる情報エコシステムの実現に向けた業界横断の協力を促進するものです。

C2PA 準拠による信頼エコシステムの構築

2024 年以降、OpenAI は来歴標準の開発と普及に参加してきました。まず、DALL·E 3 で生成された画像に Content Credentials を付与し始め、その後 ImageGen と Sora にも拡大しました。また、Coalition for Content Provenance and Authenticity、通称 C2PA の運営委員会にも加わりました。この業界横断のグループは、コンテンツ来歴のためのオープンな技術標準を定義しています。C2PA の技術的アプローチでは、メタデータと暗号署名を用いて、メディアに関する情報がメディアそのものとともに安全に移動できるようにします。その情報には、記者が情報源を評価する際に役立つ文脈、プラットフォームが真正性を判断するための材料、そしてユーザーがオンラインで見ているものを理解するための情報が含まれます。

このたび私たちは、OpenAI を C2PA Conforming Generator Product として位置づけるための一歩を踏み出しました。C2PA に準拠することで、コンテンツに付与した来歴情報をプラットフォームが信頼できる形で読み取り、保持し、引き継げるようになります。これは重要です。なぜなら、来歴情報は、コンテンツが作成された最初のプラットフォームを越えて残ってこそ本当に役立つものであり、準拠はそれを可能にするからです。

Google SynthID と組み合わせた、画像向けの階層的来歴アプローチ

C2PA メタデータは、来歴における重要な基盤です。コンテンツがどこから来たのか、どのように生成・編集されたのか、そしてその情報に誰が署名したのかを示すのに役立ちます。しかし、メタデータは完全ではありません。アップロードやダウンロードの過程で削除・消失したり、ファイル形式の変更、リサイズ、スクリーンショットといった変換によって壊れたりする可能性があります。

来歴をより堅牢にするため、私たちは階層的なアプローチを採用し始めています。まずは ChatGPT、Codex、または OpenAI API によって生成された画像から、Google DeepMind の SynthID ウォーターマーク技術の統合を開始します。SynthID は、C2PA が採用するメタデータベースのアプローチを補完する、目に見えないウォーターマークを埋め込みます。

私たちはこの取り組みを以前から進めてきました。Sora では可視ウォーターマークを、Voice Engine では音声ウォーターマークを使用しており、運用環境での精度と信頼性について引き続きテストと検証を行っています。

この 2 つの仕組みは互いを補強し合います。C2PA はコンテンツに詳細な文脈を持たせる役割を果たし、SynthID はメタデータが残らない場合でもシグナルを保持するのに役立ちます。ウォーターマークはスクリーンショットのような変換に対してより耐性があり、メタデータはウォーターマークだけでは得られないより多くの情報を提供できます。両者を組み合わせることで、どちらか一方だけよりも、来歴の堅牢性を高めることができます。

Figure 1: 2 つの画像来歴シグナルを比較する図。C2PA は信頼できる OpenAI 発行元を確認するための検証可能な署名付きメタデータを追加し、SynthID はピクセルレベルのシグナルを埋め込み、画像が OpenAI によって生成されたかどうかを検出できるようにします。

検出と、公開検証ツールのプレビュー版

信頼できるメタデータと、多くの改変に耐えるウォーターマークは、来歴シグナルをより持続的なものにします。しかし、人々には依然として、それらのシグナルを検出する手段が必要です。そこで私たちは今、アップロードされた画像に Content Credentials や SynthID を含む来歴シグナルがあるかを確認し、その画像が ChatGPT、OpenAI API、または Codex によって生成されたものかどうかを人々が検証できる公開検証ツールのプレビュー版を公開しています。

私たちは、来歴は人々にとってより簡単に検証・理解できるべきだと考えています。このツールは複数のシグナルを組み合わせることで、「これは AI によって生成されたのか？」という問いに答える助けになります。これは 2024 年の画像検出分類器の研究プレビューを基盤としており、OpenAI に由来する SynthID ウォーターマークが含まれているかどうかを高い信頼性で検出できるほか、C2PA メタデータが見つかった場合にはそれも表示します。

Figure 2: アップロードされた画像の検証結果を示す OpenAI のウェブページ。検出された SynthID と Content Credentials のシグナルに基づき、その画像が OpenAI のツールで生成されたことを確認している。

いかなる検出手法も完全ではありません。そのため、検出に失敗した場合には慎重な対応を取ります。たとえば、メタデータやウォーターマークが検出されなかったとしても、このツールはその画像が OpenAI のツールで生成されたかどうかについて断定的な判断を下しません。なぜなら、来歴シグナルは

より安全で透明性の高い AI エコシステムを実現するためのコンテンツソース認証の高度化

より安全で透明性の高い AI エコシステムに向けたコンテンツ来歴の強化

C2PA 準拠による信頼エコシステムの構築

Google SynthID と組み合わせた、画像向けの階層的来歴アプローチ

検出と、公開検証ツールのプレビュー版