OpenAIの画像フォーマット（Dall·E）

OpenAI 画像フォーマット（DALL·E）

本ページの概要

公式ドキュメント

OpenAI Images

📝 はじめに

テキストのプロンプトや入力画像に基づいて、モデルが新しい画像を生成します。OpenAI は、自然言語による指示から画像の生成・編集・加工を行える強力な画像生成モデルを複数提供しています。現在サポートされているモデルは以下のとおりです。

モデル	説明
DALL·E シリーズ	DALL·E 2 と DALL·E 3 の 2 つのバージョンを含み、画質、創造性、精度において大きな違いがあります
GPT-Image-1	OpenAI の最新画像モデル。複数画像の編集に対応しており、複数の入力画像をもとに新しい合成画像を作成できます

💡 リクエスト例

画像を作成 ✅

# 基本的な画像生成
curl https://4All API地址/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $4All API_API_KEY" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一只可爱的小海獭",
    "n": 1,
    "size": "1024x1024"
  }'

# 高品質な画像生成
curl https://4All API地址/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $4All API_API_KEY" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一只可爱的小海獭",
    "quality": "hd",
    "style": "vivid",
    "size": "1024x1024"
  }'

# base64 返却形式を使用
curl https://4All API地址/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $4All API_API_KEY" \
  -d '{
    "model": "dall-e-3",
    "prompt": "一只可爱的小海獭",
    "response_format": "b64_json"
  }'

レスポンス例:

{
  "created": 1589478378,
  "data": [
    {
      "url": "https://...",
      "revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛"
    }
  ]
}

画像を編集 ✅

curl https://4All API地址/v1/images/edits \
  -H "Authorization: Bearer $4All API_API_KEY" \
  -F image="@otter.png" \
  -F mask="@mask.png" \
  -F prompt="一只戴着贝雷帽的可爱小海獭" \
  -F n=2 \
  -F size="1024x1024"

レスポンス例:

{
  "created": 1589478378,
  "data": [
    {
      "url": "https://..."
    },
    {
      "url": "https://..."
    }
  ]
}

画像のバリエーションを生成 ✅

curl https://4All API地址/v1/images/variations \
  -H "Authorization: Bearer $4All API_API_KEY" \
  -F image="@otter.png" \
  -F n=2 \
  -F size="1024x1024"

レスポンス例:

{
  "created": 1589478378,
  "data": [
    {
      "url": "https://..."
    },
    {
      "url": "https://..."
    }
  ]
}

📮 リクエスト

エンドポイント

画像を作成

POST /v1/images/generations

テキストのプロンプトから画像を作成します。

画像を編集

POST /v1/images/edits

元の画像とプロンプトに基づいて、編集または拡張された画像を作成します。

バリエーションを生成

POST /v1/images/variations

指定した画像のバリエーションを作成します。

認証方法

API キー認証を行うには、リクエストヘッダーに以下を含めます。

Authorization: Bearer $4All API_API_KEY

ここでの $OPENAI_API_KEY は、あなたの API キーです。

リクエストボディのパラメータ

画像を作成

prompt

タイプ: string
必須: はい
説明: 生成したい画像のテキストによる説明。
dall-e-2 の最大長は 1000 文字
dall-e-3 の最大長は 4000 文字
ヒント:
具体的かつ詳細に記述する
重要な視覚要素を含める
望むアートスタイルを指定する
構図や視点を説明する

model

タイプ: string
必須: いいえ
デフォルト値: dall-e-2
説明: 画像生成に使用するモデル。

n

タイプ: integer または null
必須: いいえ
デフォルト値: 1
説明: 生成する画像の数。1-10 の範囲で指定する必要があります。dall-e-3 は n=1 のみ対応しています。

quality

タイプ: string
必須: いいえ
デフォルト値: standard
説明: 生成画像の品質。hd を指定すると、より精細で一貫性のある画像が生成されます。dall-e-3 のみがこのパラメータに対応しています。

response_format

タイプ: string または null
必須: いいえ
デフォルト値: url
説明: 生成画像の返却形式。url または b64_json のいずれかを指定する必要があります。URL の有効期限は生成後 60 分です。

size

タイプ: string または null
必須: いいえ
デフォルト値: 1024x1024
説明: 生成画像のサイズ。dall-e-2 では 256x256、512x512、1024x1024 のいずれかである必要があります。dall-e-3 では 1024x1024、1792x1024、1024x1792 のいずれかである必要があります。

style

タイプ: string または null
必須: いいえ
デフォルト値: vivid
説明: 生成画像のスタイル。vivid または natural のいずれかを指定する必要があります。vivid はよりシュールでドラマチックな画像になりやすく、natural はより自然でシュールさの少ない画像になりやすいです。dall-e-3 のみがこのパラメータに対応しています。

user

タイプ: string
必須: いいえ
説明: 最終ユーザーを表す一意の識別子。OpenAI が不正利用の監視や検出を行う際に役立ちます。

画像を編集

image

タイプ: file
必須: はい
説明: 編集対象の画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。mask を指定しない場合、画像は透明度を持っていなければならず、それがマスクとして使用されます。

prompt

タイプ: string
必須: はい
説明: 生成したい画像のテキストによる説明。最大長は 1000 文字です。

mask

タイプ: file
必須: いいえ
説明: 追加の画像。完全に透明な領域（alpha が 0 の領域）が、編集すべき位置を示します。4MB 未満の有効な PNG ファイルで、image と同じサイズである必要があります。

その他のパラメータは画像作成 API と同じです。

バリエーションを生成

image

タイプ: file
必須: はい
説明: バリエーションの元となる画像。正方形で、4MB 未満の有効な PNG ファイルである必要があります。

その他のパラメータは画像作成 API と同じです。

📥 レスポンス¶

成功レスポンス

3 つのエンドポイントはいずれも、画像オブジェクトの一覧を含むレスポンスを返します。

created

タイプ: integer
説明: レスポンスが作成されたタイムスタンプ

data

タイプ: array
説明: 生成された画像オブジェクトの一覧

画像オブジェクト

b64_json

タイプ: string
説明: response_format が b64_json の場合、生成画像の base64 エンコード済み JSON を含みます

url

タイプ: string
説明: response_format が url（デフォルト）の場合、生成画像の URL を含みます

revised_prompt

タイプ: string
説明: プロンプトに修正が加えられた場合、画像生成に使用された修正後のプロンプトを含みます

画像オブジェクトの例:

{
  "url": "https://...",
  "revised_prompt": "一只可爱的小海獭在水中嬉戏,它有着圆圆的眼睛和毛茸茸的皮毛"
}

🌟 ベストプラクティス

Prompt 作成のヒント

明確で具体的な説明を使う
重要な視覚的ディテールを指定する
望むアートスタイルや雰囲気を記述する
構図や視点の説明に注意する

パラメータ選択のヒント

モデルの選択
dall-e-3：高品質で、細部の精度が求められる用途に適しています
dall-e-2：素早い試作やシンプルな画像生成に適しています
サイズの選択
1024x1024：汎用的な用途に最適です
1792x1024/1024x1792：横長 / 縦長のシーンに適しています
小さいサイズ：サムネイルや素早いプレビューに適しています
品質とスタイル
quality=hd：細かなディテールが必要な画像向けです
style=vivid：創造的でアーティスティックな表現に適しています
style=natural：実写的な再現に適しています

よくある問題

画像生成に失敗する
prompt がコンテンツポリシーに適合しているか確認する
ファイル形式とサイズの制限を確認する
API キーの権限を確認する
結果が期待と異なる
prompt の説明を改善する
品質とスタイルのパラメータを調整する
画像編集やバリエーション機能の利用を検討する