(百炼 Qwen-Image 系列)
通过通义千问百炼系列的 Qwen-Image 模型生成图片。该接口支持提示词自动优化和中式风格的深度理解。基础信息
- 接口地址:
POST /v1/images/generations - 认证方式:
Bearer Token - 内容类型:
application/json
模型概览
万象模型
| 模型名称 | 模型简介 | 输出图像格式 |
|---|---|---|
wan2.6-t2i **推荐** | 万相2.6 支持在总像素面积与宽高比约束内,自由选尺寸(同wan2.5) | 图像分辨率:总像素在[12801280, 14401440]之间图像宽高比:[1:4, 4:1] 图像格式:png |
wan2.5-t2i-preview **推荐** | 万相2.5 preview 支持在总像素面积与宽高比约束内,自由选尺寸 (例如,支持768*2700,而2.2及以下版本单边上限 1400) | |
| wan2.2-t2i-flash | 万相2.2极速版 较2.1模型速度提升50% | 图像分辨率:宽高均在[512, 1440]像素之间 图像格式:png |
| wan2.2-t2i-plus | 万相2.2专业版 较2.1模型稳定性与成功率全面提升 | |
| wanx2.1-t2i-turbo | 万相2.1极速版 | |
| wanx2.1-t2i-plus | 万相2.1专业版 | |
| wanx2.0-t2i-turbo | 万相2.0极速版 |
千问模型
| 模型名称 | 模型简介 | 输出图像规格 |
|---|---|---|
| qwen-image-2.0-pro | 千问图像生成与编辑模型Pro系列。文字渲染、真实质感、语义遵循能力更强。 | 图像分辨率:支持自由设置宽高,输出图像总像素需在512至2048之间。默认分辨率为2028*2048。 图像格式:png 图像张数:1-6张 |
| qwen-image-plus-2026-01-09 | 千问图像生成模型Plus系列,擅长多样化艺术风格与文字渲染。 | 图像分辨率:默认分辨率为1664*928 可选的分辨率及其对应的图像宽高比例为: 1664*928(默认值):16:9 1472*1104:4:3 1328*1328:1:1 1104*1472:3:4 928*1664:9:16 |
| qwen-image |
请求头(Headers)
Content-Typestring **(必选)
请求内容类型。此参数必须设置为application/json。
Authorization string(必选)
请求身份认证。接口使用阿 API-Key 进行身份认证。示例值:Bearer sk-xxxx。
请求体参数 (Request Body)
| 参数名 | 类型 | 必选 | 描述 |
|---|---|---|---|
| model | string | 是 | 模型名称,例如:qwen-image-plus 或 qwen-image-max。 |
| input | object | 是 | 图像描述文本 |
| └─ messages | array[object] | 是 | 消息列表 |
| └─ └─ role | string | 否 | 角色 |
| └─ └─ content | array[object] | ||
| └─ └─ └─ text | string | 提示词描述文本 | |
| parameters | object | 否 | 控制生成效果的参数对象。 |
| └─negative_prompt | string | 否 | 反向提示词,用于描述不希望在图像中出现的内容,对画面进行限制。 支持中英文,长度不超过500个字符,超出部分将自动截断。 示例值:低分辨率,低画质,肢体畸形,手指畸形,画面过饱和,蜡像感,人脸无细节, 过度光滑,画面具有AI感。构图混乱。文字模糊,扭曲。 |
| └─prompt_extend | boolean | 否 | 是否开启 Prompt(提示词)智能改写功能。开启后模型将对正向提示词进行优化与润色。此功能不会修改反向提示词。 - true:默认值,开启智能改写。如果希望图像内容更多样化,由模型补充细节,建议开启此选项。 - false:关闭智能改写。如果图像细节更可控,建议关闭此选项 |
| └─watermark | boolean | 否 | 是否在图像右下角添加 “Qwen-Image” 水印。默认值为 false。水印样式:水印样式是千问 logo |
| └─size | string | 否 | 图像尺寸,例如 1328*1328、1024*1024 宽度和高度范围都要在 512-1440之间。 |
| └─n | integer | 否 | 生成图片的数量。取值范围为1~4张,默认为4。注意:按张计费,测试建议设为 1。 |
| └─seed | integer | 否 | 随机数种子,取值范围[0,2147483647]。 使用相同的seed参数值可使生成内容保持相对稳定。若不提供,算法将自动使用随机数种子。注意:模型生成过程具有概率性,即使使用相同的seed,也不能保证每次生成结果完全一致。 |
响应结果 (Response)
状态码: 200 OK| 字段名 | 类型 | 描述 |
|---|---|---|
| created | integer | 创建时的 Unix 时间戳。 |
| data | array | 生成结果列表。 |
| └─ url | string | 生成图像的下载链接。 |
| └─ b64_json | string | 图像的 Base64 编码数据(如果要求返回)。 |
| └─ revised_prompt | string | AI 自动优化后的最终提示词内容。 |
请求示例
📝 返回示例
💡 开发者建议
- 文字理解: Qwen 系列模型对中文成语、对联及中式意境(如岳阳楼、青花瓷)有极佳的还原能力。
- 提示词优化: 建议保持
prompt_extend: true,这能让生成的画面细节更丰富。

