OpenAIの画像フォーマット(Dall·E)
OpenAI 画像フォーマット(DALL·E)
Section titled “OpenAI 画像フォーマット(DALL·E)”本ページの概要
公式ドキュメント
OpenAI Images
📝 はじめに
Section titled “📝 はじめに”テキストのプロンプトや入力画像に基づいて、モデルが新しい画像を生成します。OpenAI は、自然言語による指示から画像の生成・編集・加工を行える強力な画像生成モデルを複数提供しています。現在サポートされているモデルは以下のとおりです。
| モデル | 説明 |
|---|---|
| DALL·E シリーズ | DALL·E 2 と DALL·E 3 の 2 つのバージョンを含み、画質、創造性、精度において大きな違いがあります |
| GPT-Image-1 | OpenAI の最新画像モデル。複数画像の編集に対応しており、複数の入力画像をもとに新しい合成画像を作成できます |
💡 リクエスト例
Section titled “💡 リクエスト例”画像を作成 ✅
Section titled “画像を作成 ✅”# 基本的な画像生成curl https://4All API地址/v1/images/generations \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $4All API_API_KEY" \ -d '{ "model": "dall-e-3", "prompt": "一只可爱的小海獭", "n": 1, "size": "1024x1024" }'
# 高品質な画像生成curl https://4All API地址/v1/images/generations \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $4All API_API_KEY" \ -d '{ "model": "dall-e-3", "prompt": "一只可爱的小海獭", "quality": "hd", "style": "vivid", "size": "1024x1024" }'
# base64 返却形式を使用curl https://4All API地址/v1/images/generations \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $4All API_API_KEY" \ -d '{ "model": "dall-e-3", "prompt": "一只可爱的小海獭", "response_format": "b64_json" }'レスポンス例:
{ "created": 1589478378, "data": [ { "url": "https://...", "revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛" } ]}画像を編集 ✅
Section titled “画像を編集 ✅”curl https://4All API地址/v1/images/edits \ -H "Authorization: Bearer $4All API_API_KEY" \ -F image="@otter.png" \ -F mask="@mask.png" \ -F prompt="一只戴着贝雷帽的可爱小海獭" \ -F n=2 \ -F size="1024x1024"レスポンス例:
{ "created": 1589478378, "data": [ { "url": "https://..." }, { "url": "https://..." } ]}画像のバリエーションを生成 ✅
Section titled “画像のバリエーションを生成 ✅”curl https://4All API地址/v1/images/variations \ -H "Authorization: Bearer $4All API_API_KEY" \ -F image="@otter.png" \ -F n=2 \ -F size="1024x1024"レスポンス例:
{ "created": 1589478378, "data": [ { "url": "https://..." }, { "url": "https://..." } ]}📮 リクエスト
Section titled “📮 リクエスト”エンドポイント
Section titled “エンドポイント”POST /v1/images/generationsテキストのプロンプトから画像を作成します。
POST /v1/images/edits元の画像とプロンプトに基づいて、編集または拡張された画像を作成します。
バリエーションを生成
Section titled “バリエーションを生成”POST /v1/images/variations指定した画像のバリエーションを作成します。
API キー認証を行うには、リクエストヘッダーに以下を含めます。
Authorization: Bearer $4All API_API_KEYここでの $OPENAI_API_KEY は、あなたの API キーです。
リクエストボディのパラメータ
Section titled “リクエストボディのパラメータ”prompt
Section titled “prompt”- タイプ: string
- 必須: はい
- 説明: 生成したい画像のテキストによる説明。
- dall-e-2 の最大長は 1000 文字
- dall-e-3 の最大長は 4000 文字
- ヒント:
- 具体的かつ詳細に記述する
- 重要な視覚要素を含める
- 望むアートスタイルを指定する
- 構図や視点を説明する
- タイプ: string
- 必須: いいえ
- デフォルト値: dall-e-2
- 説明: 画像生成に使用するモデル。
- タイプ: integer または null
- 必須: いいえ
- デフォルト値: 1
- 説明: 生成する画像の数。1-10 の範囲で指定する必要があります。dall-e-3 は n=1 のみ対応しています。
quality
Section titled “quality”- タイプ: string
- 必須: いいえ
- デフォルト値: standard
- 説明: 生成画像の品質。hd を指定すると、より精細で一貫性のある画像が生成されます。dall-e-3 のみがこのパラメータに対応しています。
response_format
Section titled “response_format”- タイプ: string または null
- 必須: いいえ
- デフォルト値: url
- 説明: 生成画像の返却形式。url または b64_json のいずれかを指定する必要があります。URL の有効期限は生成後 60 分です。
- タイプ: string または null
- 必須: いいえ
- デフォルト値: 1024x1024
- 説明: 生成画像のサイズ。dall-e-2 では 256x256、512x512、1024x1024 のいずれかである必要があります。dall-e-3 では 1024x1024、1792x1024、1024x1792 のいずれかである必要があります。
- タイプ: string または null
- 必須: いいえ
- デフォルト値: vivid
- 説明: 生成画像のスタイル。vivid または natural のいずれかを指定する必要があります。vivid はよりシュールでドラマチックな画像になりやすく、natural はより自然でシュールさの少ない画像になりやすいです。dall-e-3 のみがこのパラメータに対応しています。
- タイプ: string
- 必須: いいえ
- 説明: 最終ユーザーを表す一意の識別子。OpenAI が不正利用の監視や検出を行う際に役立ちます。
- タイプ: file
- 必須: はい
- 説明: 編集対象の画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。mask を指定しない場合、画像は透明度を持っていなければならず、それがマスクとして使用されます。
prompt
Section titled “prompt”- タイプ: string
- 必須: はい
- 説明: 生成したい画像のテキストによる説明。最大長は 1000 文字です。
- タイプ: file
- 必須: いいえ
- 説明: 追加の画像。完全に透明な領域(alpha が 0 の領域)が、編集すべき位置を示します。4MB 未満の有効な PNG ファイルで、image と同じサイズである必要があります。
その他のパラメータは画像作成 API と同じです。
バリエーションを生成
Section titled “バリエーションを生成”- タイプ: file
- 必須: はい
- 説明: バリエーションの元となる画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。
その他のパラメータは画像作成 API と同じです。
📥 レスポンス¶
Section titled “📥 レスポンス¶”成功レスポンス
Section titled “成功レスポンス”3 つのエンドポイントはいずれも、画像オブジェクトの一覧を含むレスポンスを返します。
created
Section titled “created”- タイプ: integer
- 説明: レスポンスが作成されたタイムスタンプ
- タイプ: array
- 説明: 生成された画像オブジェクトの一覧
画像オブジェクト
Section titled “画像オブジェクト”b64_json
Section titled “b64_json”- タイプ: string
- 説明: response_format が b64_json の場合、生成画像の base64 エンコード済み JSON を含みます
- タイプ: string
- 説明: response_format が url(デフォルト)の場合、生成画像の URL を含みます
revised_prompt
Section titled “revised_prompt”- タイプ: string
- 説明: プロンプトに修正が加えられた場合、画像生成に使用された修正後のプロンプトを含みます
画像オブジェクトの例:
{ "url": "https://...", "revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛"}🌟 ベストプラクティス
Section titled “🌟 ベストプラクティス”Prompt 作成のヒント
Section titled “Prompt 作成のヒント”- 明確で具体的な説明を使う
- 重要な視覚的ディテールを指定する
- 望むアートスタイルや雰囲気を記述する
- 構図や視点の説明に注意する
パラメータ選択のヒント
Section titled “パラメータ選択のヒント”- モデルの選択
- dall-e-3:高品質で、細部の精度が求められる用途に適しています
- dall-e-2:素早い試作やシンプルな画像生成に適しています
- サイズの選択
- 1024x1024:汎用的な用途に最適です
- 1792x1024/1024x1792:横長 / 縦長のシーンに適しています
- 小さいサイズ:サムネイルや素早いプレビューに適しています
- 品質とスタイル
- quality=hd:細かなディテールが必要な画像向けです
- style=vivid:創造的でアーティスティックな表現に適しています
- style=natural:実写的な再現に適しています
よくある問題
Section titled “よくある問題”- 画像生成に失敗する
- prompt がコンテンツポリシーに適合しているか確認する
- ファイル形式とサイズの制限を確認する
- API キーの権限を確認する
- 結果が期待と異なる
- prompt の説明を改善する
- 品質とスタイルのパラメータを調整する
- 画像編集やバリエーション機能の利用を検討する