跳转到主要内容

(百炼 Qwen-Image 系列)

通过通义千问百炼系列的 Qwen-Image 模型生成图片。该接口支持提示词自动优化和中式风格的深度理解。

基础信息

  • 接口地址: POST /v1/images/generations
  • 认证方式: Bearer Token
  • 内容类型: application/json

模型概览

万象模型

模型名称模型简介输出图像格式
wan2.6-t2i **推荐**万相2.6 支持在总像素面积与宽高比约束内,自由选尺寸(同wan2.5)图像分辨率:总像素在[12801280, 14401440]之间图像宽高比:[1:4, 4:1] 图像格式:png
wan2.5-t2i-preview **推荐**万相2.5 preview 支持在总像素面积与宽高比约束内,自由选尺寸 (例如,支持768*2700,而2.2及以下版本单边上限 1400)
wan2.2-t2i-flash万相2.2极速版 较2.1模型速度提升50%图像分辨率:宽高均在[512, 1440]像素之间 图像格式:png
wan2.2-t2i-plus万相2.2专业版 较2.1模型稳定性与成功率全面提升
wanx2.1-t2i-turbo万相2.1极速版
wanx2.1-t2i-plus万相2.1专业版
wanx2.0-t2i-turbo万相2.0极速版

千问模型

模型名称模型简介输出图像规格
qwen-image-2.0-pro千问图像生成与编辑模型Pro系列。文字渲染、真实质感、语义遵循能力更强。图像分辨率:支持自由设置宽高,输出图像总像素需在512至2048之间。默认分辨率为2028*2048。 图像格式:png 图像张数:1-6张
qwen-image-plus-2026-01-09千问图像生成模型Plus系列,擅长多样化艺术风格与文字渲染。图像分辨率:默认分辨率为1664*928 可选的分辨率及其对应的图像宽高比例为: 1664*928默认值):16:9 1472*1104:4:3 1328*1328:1:1 1104*1472:3:4 928*1664:9:16
qwen-image

请求头(Headers)

Content-Type string **(必选) 请求内容类型。此参数必须设置为application/json Authorization string(必选) 请求身份认证。接口使用阿 API-Key 进行身份认证。示例值:Bearer sk-xxxx。

请求体参数 (Request Body)

参数名类型必选描述
modelstring模型名称,例如:qwen-image-plusqwen-image-max
inputobject图像描述文本
└─ messagesarray[object]消息列表
└─ └─ rolestring角色
└─ └─ contentarray[object]
└─ └─ └─ textstring提示词描述文本
parametersobject控制生成效果的参数对象。
└─negative_promptstring反向提示词,用于描述不希望在图像中出现的内容,对画面进行限制。 支持中英文,长度不超过500个字符,超出部分将自动截断。 示例值:低分辨率,低画质,肢体畸形,手指畸形,画面过饱和,蜡像感,人脸无细节, 过度光滑,画面具有AI感。构图混乱。文字模糊,扭曲。
└─prompt_extendboolean是否开启 Prompt(提示词)智能改写功能。开启后模型将对正向提示词进行优化与润色。此功能不会修改反向提示词。 - true默认值,开启智能改写。如果希望图像内容更多样化,由模型补充细节,建议开启此选项。 - false:关闭智能改写。如果图像细节更可控,建议关闭此选项
└─watermarkboolean是否在图像右下角添加 “Qwen-Image” 水印。默认值为 false。水印样式:水印样式是千问 logo
└─sizestring图像尺寸,例如 1328*13281024*1024 宽度和高度范围都要在 512-1440之间。
└─ninteger生成图片的数量。取值范围为1~4张,默认为4。注意:按张计费,测试建议设为 1。
└─seedinteger随机数种子,取值范围[0,2147483647]。 使用相同的seed参数值可使生成内容保持相对稳定。若不提供,算法将自动使用随机数种子。注意:模型生成过程具有概率性,即使使用相同的seed,也不能保证每次生成结果完全一致。

响应结果 (Response)

状态码: 200 OK
字段名类型描述
createdinteger创建时的 Unix 时间戳。
dataarray生成结果列表。
└─ urlstring生成图像的下载链接。
└─ b64_jsonstring图像的 Base64 编码数据(如果要求返回)。
└─ revised_promptstringAI 自动优化后的最终提示词内容。

请求示例

{
    "model": "wan2.2-t2i-flash",
    "prompt": "一只小猫在草地上奔跑,电影感,光影自然",
    "size": "960*1390"
}

📝 返回示例

{
  "created": 1713833628,
  "data": [
    {
      "url": "https://example.com/qwen_output_image.png",
     	"b64_json": "",
      "revised_prompt": ""
    }
  ]
  ...
}

💡 开发者建议

  1. 文字理解: Qwen 系列模型对中文成语、对联及中式意境(如岳阳楼、青花瓷)有极佳的还原能力。
  2. 提示词优化: 建议保持 prompt_extend: true,这能让生成的画面细节更丰富。