图像生成
图标说明
输入: 文本 · 图像
Gemini Nano Banana
详细使用方式请参考 Nano Banana API 指南。
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每百万 Tokens) | 上线时间 | 预计下线时间 | 负载能力 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|---|---|
| Vertex AI | turing/gemini-2.5-flash-image | 输入: 输出: Tools: 不支持 | v1/chat/completions | 输入: $0.3输出: $30 | 2025-09-12 | - | Vertex AI 多项目 | 中国区 欧洲区 北美区 | - |
| Vertex AI | turing/gemini-3-pro-image | 输入: 输出: Tools: 不支持 | v1/chat/completions | 输入: $2输出: $60 | 2025-09-12 | - | Vertex AI 多项目 | 中国区 欧洲区 北美区 | - |
| Vertex AI | turing/gemini-3.1-flash-lite-image | 输入: 输出: Tools: 不支持 | v1/chat/completions | 输入: $0.25文本输出: $1.50图像输出: $30 | 2026-07-01 | - | Vertex AI 多项目 | 中国区 欧洲区 北美区 | Nano Banana 2 Lite,最高 1K 输出 |
Azure OpenAI
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每张图片) | 上线时间 | 预计下线时间 | 负载能力 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|---|---|
| Azure | turing/gpt-image-2 | 输入: 输出: Tools: 不支持 | v1/images/generations | 按 token 计费 (per 1M tokens):文本输入: $5.00 / 缓存 $1.25图像输入: $8.00 / 缓存 $2.00图像输出: $30.00 | 2026-04-23 | - | 全球 | 中国区 欧洲区 北美区 | 公开预览。支持任意分辨率(4K)、可选透明背景 |
| Azure | turing/gpt-image-1 | 输入: 输出: Tools: 不支持 | v1/images/generations | Low Quality: $0.011 (1024x1024) $0.016 (1024x1536) $0.016 (1536x1024)Medium Quality: $0.042 (1024x1024) $0.063 (1024x1536) $0.063 (1536x1024)High Quality: $0.167 (1024x1024) $0.25 (1024x1536) $0.25 (1536x1024) | 2025-06-19 | - | 全球 | 中国区 欧洲区 北美区 | - |
| Azure | turing/dall-e-3 | 输入: 输出: Tools: 不支持 | v1/images/generations | $0.04 (1024x1024)$0.08 (1024x1536)$0.08 (1536x1024) | 2025-04-22 | 2026-02-18 | 全球 | 中国区 欧洲区 北美区 | - |
GPT-image-2 技术规格
公开预览阶段,详见 图像生成 API → GPT-image-2。
分辨率支持
gpt-image-2 不再受限于固定的几个分辨率,可传入任意尺寸字符串(格式 <w>x<h>),需满足:
- 两条边均为 16 像素的整数倍
- 长边 ≤ 3840 px(支持 4K)
- 宽高比 ≤ 3:1
- 总像素数在
655,360~8,294,400之间
也可以传 size="auto",由模型自动选择尺寸。
图像生成能力
| 能力 | 说明 |
|---|---|
| 文本到图像 | POST /v1/images/generations |
| 透明背景 | background="transparent"(仅 output_format="png") |
字节火山
| 厂商 | 接口模型ID | 模型能力 | endpoint | 价格(每张图片) | 上线时间 | 预计下线时间 | 负载能力 | 支持访问地区 | 备注 |
|---|---|---|---|---|---|---|---|---|---|
| 字节火山 | doubao-seedream-4-0-250828 | 输入: 输出: Tools: 不支持 | v1/images/generations | ¥0.2 per image | 2025-12-12 | - | 字节火山 | 中国区 | - |
| 字节火山 | doubao-seedream-4-5-251128 | 输入: 输出: Tools: 不支持 | v1/images/generations | ¥0.25 per image | 2025-12-12 | - | 字节火山 | 中国区 | - |
| 字节火山 | doubao-seedream-5-0-lite-260128 | 输入: 输出: Tools: 联网搜索 | v1/images/generations | ¥0.22 per image | 2026-01-28 | - | 字节火山 | 中国区 | 支持联网搜索(web_search) |
Seedream 技术规格
分辨率支持
| 模型 | 支持分辨率 |
|---|---|
| doubao-seedream-4-0-250828 | 1K、2K、4K |
| doubao-seedream-4-5-251128 | 2K、4K |
| doubao-seedream-5-0-lite-260128 | 2K、3K、4K |
- 宽高比范围: [1/16, 16]
- 支持图像格式: JPEG, PNG, WEBP, BMP, TIFF, GIF(
doubao-seedream-5-0-lite-260128额外支持 HEIC、HEIF)
图像生成能力
- 文本到图像: 根据文本描述生成高质量图像
- 图像到图像: 基于参考图像生成新图像
- 多图像融合: 支持 2-14 张参考图像 + 文本提示生成图像
- 批量图像生成: 最多 15 张图像(输入图像数 + 生成图像数 ≤ 15)
n 参数与批量生成
当使用 Seedream 模型时,n 参数会自动转换为批量图像生成参数:
# 设置 n=3 时,平台自动转换为:
payload["sequential_image_generation"] = "auto"
payload["sequential_image_generation_options"] = {"max_images": 3}
sequential_image_generation 可选值:
"auto": 模型自动决定是否返回多张图像及数量"disabled": 仅生成一张图像