聊天
通用对话接口
POST
- 统一的对话API接口,支持所有文本生成模型
- 通过 model 参数选择不同的AI模型
- 兼容 OpenAI Chat Completions API 格式
Authorizations
Body
模型名称支持的模型包括:OpenAI
gpt-4.1 gpt-4o gpt-5 gpt-5-high gpt-5-codex gpt-5-low gpt-5-medium gpt-5.1 gpt-5.2 gpt-5.3 gpt-5.4 gpt-5.5Anthropic claude-opus-4-5 claude-opus-4-6 claude-opus-4-7 claude-sonnet-4-5 claude-sonnet-4-6Google gemini-2.5-flash gemini-2.0-flash gemini-2.0-flash-lite gemini-2.5-flash-image gemini-2.5-pro gemini-3-pro-preview gemini-3-flash gemini-3-flash-preview gemini-3.1-pro-preview gemini-3.1-flash-lite-previewDeepSeek deepseek-r1 deepseek-v3 deepseek-v3-1-250821 deepseek-v3.2 deepseek-v4-flash deepseek-v4-proMiniMax MiniMax-M2.5智普 glm-5 glm-5.1阿里巴巴 qwen-flash qwen-max qwen-plus qwen3-max qwen3-coder-flash- 更多模型持续更新中…
对话消息列表消息数组,每条消息包含 进阶用法:添加系统提示词(让 AI 扮演特定角色):多轮对话(包含上下文):角色说明:
role 和 content 两个字段。示例:user: 用户消息(大多数情况用这个)system: 系统提示词,设置 AI 的行为和角色assistant: AI 的历史回复,用于多轮对话时提供上下文
控制输出随机性,范围 0-2
- 较低的值(如 0.2)使输出更确定
- 较高的值(如 1.8)使输出更随机
生成的最大token数量不同模型有不同的最大值限制,请参考具体模型文档
是否使用流式输出
true: 流式返回(SSE格式)false: 一次性返回完整响应
核采样参数,范围 0-1控制生成文本的多样性,建议与 temperature 二选一使用默认值:1.0
频率惩罚,范围 -2.0 到 2.0正值会降低重复使用相同词汇的可能性默认值:0
存在惩罚,范围 -2.0 到 2.0正值会增加谈论新主题的可能性默认值:0
停止序列最多4个序列,遇到这些序列时将停止生成
生成的回复数量默认值:1⚠️ 注意: 必须输入纯数字(如
1),不要加引号,否则会报错Response
响应的唯一标识符
对象类型,固定为
chat.completion创建时间戳
实际使用的模型名称
生成的回复列表
token使用统计

