POST
/v1/chat/completionsChat Completions API
创建对话补全响应。接口完全兼容 OpenAI Chat Completions 格式,可直接使用 OpenAI 官方 SDK(Python / Node.js)接入,只需修改 base_url 和 api_key。支持流式输出、多轮对话、Function Calling、视觉理解等能力。
请求端点
POST
https://nexusflow.hk/v1/chat/completions请求头
请求参数
代码示例
响应格式(非流式)
非流式请求返回完整的 JSON 对象,object 字段值为 "chat.completion"。
响应示例
响应字段
流式响应格式(SSE)
当 stream: true 时,响应以 Server-Sent Events (SSE) 格式逐步返回。每条事件以 data: 开头,最后以 data: [DONE] 标记结束。每个 chunk 的 object 字段值为 "chat.completion.chunk"。
SSE 数据格式
Chunk 字段说明
提示:使用 OpenAI SDK 时无需手动解析 SSE,SDK 会自动处理流式响应并提供迭代器接口。仅在使用 cURL 或原生 HTTP 客户端时需要自行解析 SSE 数据。
与百炼官方 Chat API 的关系
NexusFlow 的
/v1/chat/completions 与阿里云百炼 OpenAI 兼容端点完全协议透传: 请求体原样转发上游,响应原样回传。tools、tool_choice、response_format、enable_thinking、thinking_budget、enable_search、search_options、seed、top_k、logprobs、stream_options 等百炼扩展字段都可直接使用, 具体支持范围以模型为准。官方参考: 千问 API 参考。注意事项
- 不同模型的
max_tokens上限不同,请参考 模型列表 了解各模型限制。 temperature和top_p建议只调节其中一个,同时设置可能产生不可预期的结果。- 流式输出时,只有最后一个 chunk 的
finish_reason为非 null 值,代表生成结束。 - 图像理解功能建议使用 Qwen-VL 系列等多模态模型。
content需传入数组格式包含image_url类型。 - Function Calling 推荐使用 Qwen、DeepSeek、GLM 等支持工具调用的模型系列。
- 思考模式(
enable_thinking)必须按模型 ID 使用;支持矩阵见 参数矩阵。 - 请求体与上游百炼协议透传,文档之外的百炼扩展字段(如
thinking_budget、enable_search、search_options)可直接使用,具体支持以模型为准。 - 完整参数说明与模型兼容矩阵见 参数矩阵。
模型列表
查看所有可用模型与能力
错误码
错误码说明与排查指南
限流说明
请求频率限制与配额