跳到主要内容

图像生成

图标说明

输入: 文本 · 图像

Gemini Nano Banana

详细使用方式请参考 Nano Banana API 指南

厂商接口模型ID模型能力endpoint价格(每百万 Tokens)上线时间预计下线时间负载能力支持访问地区备注
Vertex AIturing/gemini-2.5-flash-image输入:
输出:
Tools: 不支持
v1/chat/completions输入: $0.3
输出: $30
2025-09-12-Vertex AI 多项目中国区
欧洲区
北美区
-
Vertex AIturing/gemini-3-pro-image输入:
输出:
Tools: 不支持
v1/chat/completions输入: $2
输出: $60
2025-09-12-Vertex AI 多项目中国区
欧洲区
北美区
-
Vertex AIturing/gemini-3.1-flash-lite-image输入:
输出:
Tools: 不支持
v1/chat/completions输入: $0.25
文本输出: $1.50
图像输出: $30
2026-07-01-Vertex AI 多项目中国区
欧洲区
北美区
Nano Banana 2 Lite,最高 1K 输出

Azure OpenAI

厂商接口模型ID模型能力endpoint价格(每张图片)上线时间预计下线时间负载能力支持访问地区备注
Azureturing/gpt-image-2输入:
输出:
Tools: 不支持
v1/images/generations按 token 计费 (per 1M tokens):
文本输入: $5.00 / 缓存 $1.25
图像输入: $8.00 / 缓存 $2.00
图像输出: $30.00
2026-04-23-全球中国区
欧洲区
北美区
公开预览。支持任意分辨率(4K)、可选透明背景
Azureturing/gpt-image-1输入:
输出:
Tools: 不支持
v1/images/generationsLow Quality: $0.011 (1024x1024) $0.016 (1024x1536) $0.016 (1536x1024)
Medium Quality: $0.042 (1024x1024) $0.063 (1024x1536) $0.063 (1536x1024)
High Quality: $0.167 (1024x1024) $0.25 (1024x1536) $0.25 (1536x1024)
2025-06-19-全球中国区
欧洲区
北美区
-
Azureturing/dall-e-3输入:
输出:
Tools: 不支持
v1/images/generations$0.04 (1024x1024)
$0.08 (1024x1536)
$0.08 (1536x1024)
2025-04-222026-02-18全球中国区
欧洲区
北美区
-

GPT-image-2 技术规格

公开预览阶段,详见 图像生成 API → GPT-image-2

分辨率支持

gpt-image-2 不再受限于固定的几个分辨率,可传入任意尺寸字符串(格式 <w>x<h>),需满足:

  • 两条边均为 16 像素的整数倍
  • 长边 ≤ 3840 px(支持 4K)
  • 宽高比 ≤ 3:1
  • 总像素数655,360 ~ 8,294,400 之间

也可以传 size="auto",由模型自动选择尺寸。

图像生成能力

能力说明
文本到图像POST /v1/images/generations
透明背景background="transparent"(仅 output_format="png"

字节火山

厂商接口模型ID模型能力endpoint价格(每张图片)上线时间预计下线时间负载能力支持访问地区备注
字节火山doubao-seedream-4-0-250828输入:
输出:
Tools: 不支持
v1/images/generations¥0.2 per image2025-12-12-字节火山中国区-
字节火山doubao-seedream-4-5-251128输入:
输出:
Tools: 不支持
v1/images/generations¥0.25 per image2025-12-12-字节火山中国区-
字节火山doubao-seedream-5-0-lite-260128输入:
输出:
Tools: 联网搜索
v1/images/generations¥0.22 per image2026-01-28-字节火山中国区支持联网搜索(web_search)

Seedream 技术规格

分辨率支持

模型支持分辨率
doubao-seedream-4-0-2508281K、2K、4K
doubao-seedream-4-5-2511282K、4K
doubao-seedream-5-0-lite-2601282K、3K、4K
  • 宽高比范围: [1/16, 16]
  • 支持图像格式: JPEG, PNG, WEBP, BMP, TIFF, GIF(doubao-seedream-5-0-lite-260128 额外支持 HEIC、HEIF)

图像生成能力

  • 文本到图像: 根据文本描述生成高质量图像
  • 图像到图像: 基于参考图像生成新图像
  • 多图像融合: 支持 2-14 张参考图像 + 文本提示生成图像
  • 批量图像生成: 最多 15 张图像(输入图像数 + 生成图像数 ≤ 15)

n 参数与批量生成

当使用 Seedream 模型时,n 参数会自动转换为批量图像生成参数:

# 设置 n=3 时,平台自动转换为:
payload["sequential_image_generation"] = "auto"
payload["sequential_image_generation_options"] = {"max_images": 3}

sequential_image_generation 可选值:

  • "auto": 模型自动决定是否返回多张图像及数量
  • "disabled": 仅生成一张图像