跳转到主要内容

百炼 Qwen-Image 系列

通过通义千问百炼系列的 Qwen-Image-Edit 模型,根据参考图(如深度图、边缘图等)和提示词生成或编辑图像。

模型预览

千问模型

模型名称模型简介输出图像规格
qwen-image-edit-plus千问图像编辑Plus系列,支持多图输出与自定义分辨率。图像分辨率:
- 可指定:宽和高的取值范围均为[512, 2048]像素。
- 默认:总像素数接近 1024*1024,宽高比与输入图(多图输入时为最后一张)相近。
图像格式:png
图像张数:1-6张
qwen-image-edit-plus-2025-12-15
qwen-image-edit支持单图编辑和多图融合。图像分辨率:不可指定。生成规则同上方的默认规则。
图像格式:png
图像张数:固定1张

基础信息

  • 接口地址: POST /v1/images/edits
  • 认证方式: Bearer Token (Authorization: Bearer sk-xxxxxx)
  • 内容类型: application/json

请求头(Headers)

Content-Type string **(必选) 请求内容类型。此参数必须设置为application/json Authorization string(必选) 请求身份认证。接口使用阿 API-Key 进行身份认证。示例值:Bearer sk-xxxx。

请求参数 (Request Body)

通义千问格式
参数名类型必选描述
modelstring模型名称,例如:qwen-image-edit-plus
inputobject输入内容对象。
└─ messagesarray包含消息列表。
└─ └─ rolestring角色,通常为 user
└─ └─ contentarray包含 image (参考图 URL) 和 text (编辑描述) 的数组。
└─ └─ └─ ** image **string- 图像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP和GIF。
输出图像为PNG格式,对于GIF动图,仅处理其第一帧。
- 图像分辨率:为获得最佳效果,建议图像的宽和高均在384像素至3072像素之间。分辨率过低可能导致生成效果模糊,过高则会增加处理时长。
- 图像大小:不超过10MB。
- 输入格式 file 平台会自动转成 base64,如果需要传公网 url 请使用通义千问格式传参
支持的输入格式
1. 公网URL:
- 支持 HTTP 和 HTTPS 协议。
- 示例值:https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/fpakfo/image36.webp
2. 临时URL:
- 支持OSS协议,必须通过上传文件获取临时 URL
- 示例值:oss://dashscope-instant/xxx/2024-07-18/xxx/cat.png
3. 传入 Base64 编码图像后的字符串
- 示例值:data:image/jpeg;base64,GDU7MtCZz...(示例已截断,仅做演示)
└─ └─ └─ ** text **string正向提示词,用于描述期望生成的图像内容、风格和构图。
支持中英文,长度不超过800个字符,每个汉字、字母、数字或符号计为一个字符,超过部分会自动截断。
示例值:图1中的女生穿着图2中的黑色裙子按图3的姿势坐下,保持其服装、发型和表情不变,动作自然流畅。
注意content数组中必须包含且仅包含一个text对象,否则将报错。
parametersobject控制参数对象。
└─ ninteger生成图像的数量,默认值为1。
对于qwen-image-2.0系列、qwen-image-edit-max、qwen-image-edit-plus系列模型,可选择输出1-6张图片。
对于qwen-image-edit,仅支持输出1张图片。
└─ negative_promptstring反向提示词,用来描述不希望在画面中看到的内容,可以对画面进行限制。
支持中英文,长度上限500个字符,每个汉字、字母、数字或符号计为一个字符,超过部分会自动截断。
示例值:低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等。
└─ watermarkboolean是否添加水印。
└─ seedinteger随机数种子,取值范围[0,2147483647]
使用相同的seed参数值可使生成内容保持相对稳定。若不提供,算法将自动使用随机数种子。
注意:模型生成过程具有概率性,即使使用相同的seed,也不能保证每次生成结果完全一致。

📤 响应结果 (Response)

状态码: 200 OK
字段名类型描述
createdintegerUnix 时间戳。
dataarray结果列表。
└─ urlstring编辑后的图像 URL 地址。
└─ b64_jsonstring图像的 Base64 数据。
└─ revised_promptstringAI 优化后的实际执行提示词。

📝 请求示例

{
  "model": "qwen-image-edit-plus",
  "input": {
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "image": "https://example.com/reference_depth_map.webp"
          },
          {
            "text": "生成一张符合深度图的图像,遵循以下描述:一辆红色的破旧自行车停在一条泥泞的小路上,背景是茂密的原始森林"
          }
        ]
      }
    ]
  },
  "parameters": {
    "n": 1,
    "prompt_extend": true,
    "watermark": false
  }
}

💡 开发者建议

  1. 参考图模式: 与 OpenAI 的透明遮罩编辑不同,Qwen 的编辑接口常用于“结构控制”,例如提供一张深度图或线稿图,让模型在此基础上生成符合描述的图像。
  2. 多模态输入: 在 content 数组中,必须同时包含一个 image 对象和一个 text 对象,以确保模型既有视觉参考又有文本指令。