コンテンツにスキップ

OpenAIの画像フォーマット(Dall·E)

OpenAI 画像フォーマット(DALL·E)

Section titled “OpenAI 画像フォーマット(DALL·E)”

本ページの概要

公式ドキュメント

OpenAI Images

テキストのプロンプトや入力画像に基づいて、モデルが新しい画像を生成します。OpenAI は、自然言語による指示から画像の生成・編集・加工を行える強力な画像生成モデルを複数提供しています。現在サポートされているモデルは以下のとおりです。

モデル説明
DALL·E シリーズDALL·E 2 と DALL·E 3 の 2 つのバージョンを含み、画質、創造性、精度において大きな違いがあります
GPT-Image-1OpenAI の最新画像モデル。複数画像の編集に対応しており、複数の入力画像をもとに新しい合成画像を作成できます
# 基本的な画像生成
curl https://4All API地址/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $4All API_API_KEY" \
-d '{
"model": "dall-e-3",
"prompt": "一只可爱的小海獭",
"n": 1,
"size": "1024x1024"
}'
# 高品質な画像生
curl https://4All API地址/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $4All API_API_KEY" \
-d '{
"model": "dall-e-3",
"prompt": "一只可爱的小海獭",
"quality": "hd",
"style": "vivid",
"size": "1024x1024"
}'
# base64 返却形式を使
curl https://4All API地址/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $4All API_API_KEY" \
-d '{
"model": "dall-e-3",
"prompt": "一只可爱的小海獭",
"response_format": "b64_json"
}'

レスポンス例:

{
"created": 1589478378,
"data": [
{
"url": "https://...",
"revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛"
}
]
}
curl https://4All API地址/v1/images/edits \
-H "Authorization: Bearer $4All API_API_KEY" \
-F image="@otter.png" \
-F mask="@mask.png" \
-F prompt="一只戴着贝雷帽的可爱小海獭" \
-F n=2 \
-F size="1024x1024"

レスポンス例:

{
"created": 1589478378,
"data": [
{
"url": "https://..."
},
{
"url": "https://..."
}
]
}

画像のバリエーションを生成 ✅

Section titled “画像のバリエーションを生成 ✅”
curl https://4All API地址/v1/images/variations \
-H "Authorization: Bearer $4All API_API_KEY" \
-F image="@otter.png" \
-F n=2 \
-F size="1024x1024"

レスポンス例:

{
"created": 1589478378,
"data": [
{
"url": "https://..."
},
{
"url": "https://..."
}
]
}
POST /v1/images/generations

テキストのプロンプトから画像を作成します。

POST /v1/images/edits

元の画像とプロンプトに基づいて、編集または拡張された画像を作成します。

POST /v1/images/variations

指定した画像のバリエーションを作成します。

API キー認証を行うには、リクエストヘッダーに以下を含めます。

Authorization: Bearer $4All API_API_KEY

ここでの $OPENAI_API_KEY は、あなたの API キーです。

リクエストボディのパラメータ

Section titled “リクエストボディのパラメータ”
  • タイプ: string
  • 必須: はい
  • 説明: 生成したい画像のテキストによる説明。
  • dall-e-2 の最大長は 1000 文字
  • dall-e-3 の最大長は 4000 文字
  • ヒント:
  • 具体的かつ詳細に記述する
  • 重要な視覚要素を含める
  • 望むアートスタイルを指定する
  • 構図や視点を説明する
  • タイプ: string
  • 必須: いいえ
  • デフォルト値: dall-e-2
  • 説明: 画像生成に使用するモデル。
  • タイプ: integer または null
  • 必須: いいえ
  • デフォルト値: 1
  • 説明: 生成する画像の数。1-10 の範囲で指定する必要があります。dall-e-3 は n=1 のみ対応しています。
  • タイプ: string
  • 必須: いいえ
  • デフォルト値: standard
  • 説明: 生成画像の品質。hd を指定すると、より精細で一貫性のある画像が生成されます。dall-e-3 のみがこのパラメータに対応しています。
  • タイプ: string または null
  • 必須: いいえ
  • デフォルト値: url
  • 説明: 生成画像の返却形式。url または b64_json のいずれかを指定する必要があります。URL の有効期限は生成後 60 分です。
  • タイプ: string または null
  • 必須: いいえ
  • デフォルト値: 1024x1024
  • 説明: 生成画像のサイズ。dall-e-2 では 256x256、512x512、1024x1024 のいずれかである必要があります。dall-e-3 では 1024x1024、1792x1024、1024x1792 のいずれかである必要があります。
  • タイプ: string または null
  • 必須: いいえ
  • デフォルト値: vivid
  • 説明: 生成画像のスタイル。vivid または natural のいずれかを指定する必要があります。vivid はよりシュールでドラマチックな画像になりやすく、natural はより自然でシュールさの少ない画像になりやすいです。dall-e-3 のみがこのパラメータに対応しています。
  • タイプ: string
  • 必須: いいえ
  • 説明: 最終ユーザーを表す一意の識別子。OpenAI が不正利用の監視や検出を行う際に役立ちます。
  • タイプ: file
  • 必須: はい
  • 説明: 編集対象の画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。mask を指定しない場合、画像は透明度を持っていなければならず、それがマスクとして使用されます。
  • タイプ: string
  • 必須: はい
  • 説明: 生成したい画像のテキストによる説明。最大長は 1000 文字です。
  • タイプ: file
  • 必須: いいえ
  • 説明: 追加の画像。完全に透明な領域(alpha が 0 の領域)が、編集すべき位置を示します。4MB 未満の有効な PNG ファイルで、image と同じサイズである必要があります。

その他のパラメータは画像作成 API と同じです。

  • タイプ: file
  • 必須: はい
  • 説明: バリエーションの元となる画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。

その他のパラメータは画像作成 API と同じです。

3 つのエンドポイントはいずれも、画像オブジェクトの一覧を含むレスポンスを返します。

  • タイプ: integer
  • 説明: レスポンスが作成されたタイムスタンプ
  • タイプ: array
  • 説明: 生成された画像オブジェクトの一覧
  • タイプ: string
  • 説明: response_format が b64_json の場合、生成画像の base64 エンコード済み JSON を含みます
  • タイプ: string
  • 説明: response_format が url(デフォルト)の場合、生成画像の URL を含みます
  • タイプ: string
  • 説明: プロンプトに修正が加えられた場合、画像生成に使用された修正後のプロンプトを含みます

画像オブジェクトの例:

{
"url": "https://...",
"revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛"
}
  • 明確で具体的な説明を使う
  • 重要な視覚的ディテールを指定する
  • 望むアートスタイルや雰囲気を記述する
  • 構図や視点の説明に注意する
  • モデルの選択
  • dall-e-3:高品質で、細部の精度が求められる用途に適しています
  • dall-e-2:素早い試作やシンプルな画像生成に適しています
  • サイズの選択
  • 1024x1024:汎用的な用途に最適です
  • 1792x1024/1024x1792:横長 / 縦長のシーンに適しています
  • 小さいサイズ:サムネイルや素早いプレビューに適しています
  • 品質とスタイル
  • quality=hd:細かなディテールが必要な画像向けです
  • style=vivid:創造的でアーティスティックな表現に適しています
  • style=natural:実写的な再現に適しています
  • 画像生成に失敗する
  • prompt がコンテンツポリシーに適合しているか確認する
  • ファイル形式とサイズの制限を確認する
  • API キーの権限を確認する
  • 結果が期待と異なる
  • prompt の説明を改善する
  • 品質とスタイルのパラメータを調整する
  • 画像編集やバリエーション機能の利用を検討する