API 参考
参数矩阵
这里按后端实际透传和协议转换逻辑列出参数。文本类模型支持 OpenAI、Anthropic、Gemini 三种协议;非文本模型按模型能力使用图像、音频、向量或异步任务接口。
OpenAI Chat Completions
参数
类型/映射
状态
说明
modelstring
必填
模型 ID。文本、推理、多模态、编程和专业模型支持 Chat Completions。
messagesarray
必填
对话消息数组,按顺序传入 system、user、assistant、tool。
messages[].rolestring
必填
system / user / assistant / tool。tool 消息用于回传工具执行结果。
messages[].contentstring | array
必填
文本可直接传字符串;多模态输入传内容块数组。
messages[].content[].typestring
多模态
稳定示例为 text / image_url;video、input_audio 等百炼扩展内容块需按具体模型实测。
messages[].content[].textstring
多模态
type=text 时的文本。
messages[].content[].image_url.urlstring
多模态
图片 URL 或 data URL,需模型支持视觉理解。
streamboolean
可选
开启 SSE 流式输出。长文本、推理模型和交互场景建议开启。
stream_options.include_usageboolean
可选
流式响应最后返回 usage。需要计费、统计或 smoke 校验时建议开启。
temperaturenumber
可选
采样温度。范围通常为 0 到 2;越高越随机。
top_pnumber
可选
核采样阈值。建议不要和 temperature 同时大幅调整。
max_tokensinteger
可选
最大输出 token 数,不能超过模型 maxOutput。
stopstring | string[]
可选
停止序列,命中后结束输出。
presence_penaltynumber
可选
存在惩罚,通常范围 -2 到 2,增加新话题倾向。
frequency_penaltynumber
可选
频率惩罚,通常范围 -2 到 2,降低重复表达。
toolsarray
可选
函数调用定义数组。支持工具调用的模型才会稳定返回 tool_calls。
tools[].typestring
工具
固定为 function。
tools[].function.namestring
工具
函数名。建议使用字母、数字和下划线。
tools[].function.descriptionstring
工具
函数用途说明,影响模型选择工具的准确性。
tools[].function.parametersobject
工具
JSON Schema,描述函数入参。
tool_choicestring | object
可选
稳定支持 auto / none,或指定 {type:'function', function:{name}}。思考模式模型不建议强制工具。
response_formatobject
可选
输出格式控制。常见值为 {"type":"text"} 或 {"type":"json_object"}。
enable_thinkingboolean
可选
思考模式开关。仅对已验证支持的混合思考模型可关闭;仅思考模型会忽略 false 并继续返回 reasoning_content。
thinking_budgetinteger
可选
限制思考 Token 上限,按模型 ID 前缀透传(qwen3.7- / qwen3.6- / qwen3.5- / qwen3-)。
preserve_thinkingboolean
可选
将历史消息中的 reasoning_content 透传回模型,支持 qwen3.7-max、qwen3.6-max-preview、qwen3.6-plus、kimi-k2.6。
enable_searchboolean
可选
联网搜索,支持通义千问文本类模型(非 VL / math 系列)。
search_optionsobject
可选
联网搜索配置,与 enable_search 配套使用。
seedinteger
可选
随机种子,通义千问文本模型支持透传。
top_kinteger
可选
Top-K 采样,通义千问文本模型支持透传。
logprobsboolean
可选
返回 log 概率,通义千问文本模型支持透传。
repetition_penaltynumber
可选
重复惩罚,通义千问文本模型支持透传。
parallel_tool_callsboolean
可选
并行工具调用,支持通义千问、DeepSeek、GLM、Anthropic 模型。
暂未支持的字段
下表列出目前公共 Chat 入口尚未稳定透传的字段;生产代码请勿依赖。
参数
类型/映射
状态
说明
max_completion_tokensinteger
暂未透传
请使用当前稳定支持的 max_tokens。
思考模式支持情况
这里列的是 NexusFlow 线上 OpenAI Chat 入口的实测行为。支持情况会随上游模型版本变化,生产代码应按模型 ID 做显式配置。
参数
类型/映射
状态
说明
qwen3.7-max混合思考
支持 true / false
默认开启思考;true 返回 reasoning_content;false 不返回。支持 thinking_budget 和 preserve_thinking。
qwen3.5-flash混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
qwen3-max混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
qwq-plus仅思考
false 不能关闭
线上验证:true/false 都返回 reasoning_content。
qwen-math-plus未按思考开关处理
不要传
线上验证:true/false 都未返回 reasoning_content。
deepseek-r1仅思考
false 不能关闭
线上验证:true/false 都返回 reasoning_content。
deepseek-v3.2混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
deepseek-v4-pro混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
glm-5.1混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
Anthropic Messages 映射
参数
类型/映射
状态
modelmodel
模型 ID,映射到 OpenAI model。
systemmessages[0].role=system
系统提示词。支持字符串或 text blocks。
messagesmessages
user / assistant 消息会转换成 OpenAI 消息。
messages[].content[].textmessages[].content
文本块。纯文本块会合并为字符串。
messages[].content[].imageimage_url
支持 url 或 base64 source,转换为 OpenAI image_url。
messages[].content[].tool_useassistant.tool_calls
助手工具调用结果。
messages[].content[].tool_resultrole=tool
工具执行结果回传。
max_tokensmax_tokens
最大输出 token。
temperaturetemperature
采样温度。
top_ptop_p
核采样。
stop_sequencesstop
停止序列数组。
streamstream
开启 Anthropic SSE 事件流。
toolstools
Anthropic tools 会转换为 OpenAI function tools。
tool_choicetool_choice
auto / none / any / tool 会转换为 OpenAI tool_choice。
Gemini GenerateContent 映射
参数
类型/映射
状态
contentsmessages
消息数组。字符串 contents 也会被包装成 user 文本消息。
contents[].rolemessages[].role
user 映射 user,model 映射 assistant。
contents[].parts[].textcontent text
文本内容。
contents[].parts[].inlineDataimage_url data URL
base64 图片内容,转换为 image_url。
contents[].parts[].fileDataimage_url
文件 URL,转换为 image_url。
contents[].parts[].functionCallassistant.tool_calls
模型函数调用。
contents[].parts[].functionResponserole=tool
工具执行结果。
systemInstructionsystem message
系统提示词,支持字符串或 parts。
generationConfig.temperaturetemperature
采样温度。
generationConfig.topPtop_p
核采样。
generationConfig.maxOutputTokensmax_tokens
最大输出 token。
generationConfig.stopSequencesstop
停止序列数组。
tools[].functionDeclarationstools
函数声明,转换为 OpenAI function tools。
toolConfig.functionCallingConfig.modetool_choice
AUTO / ANY / NONE 分别映射 auto / required / none;部分上游模型可能不接受 required。
streamGenerateContentstream=true
流式接口。使用 ?alt=sse 时按 SSE 返回。
响应字段
参数
类型/映射
choices[].message.content非流式文本输出。
choices[].message.reasoning_content推理模型可能返回的思考内容字段。
choices[].message.tool_calls模型请求调用工具时返回。
choices[].delta.content流式文本增量。
choices[].delta.reasoning_content流式思考增量,推理模型可能返回。
choices[].finish_reasonstop / length / tool_calls / content_filter。
usage.prompt_tokens输入 token。
usage.completion_tokens输出 token。
usage.total_tokens总 token。
usage.completion_tokens_details.reasoning_tokens推理 token,部分模型返回。