nexusflow
在线
API 参考

参数矩阵

这里按后端实际透传和协议转换逻辑列出参数。文本类模型支持 OpenAI、Anthropic、Gemini 三种协议;非文本模型按模型能力使用图像、音频、向量或异步任务接口。

OpenAI Chat Completions

参数
类型/映射
状态
说明
model
string
必填
模型 ID。文本、推理、多模态、编程和专业模型支持 Chat Completions。
messages
array
必填
对话消息数组,按顺序传入 system、user、assistant、tool。
messages[].role
string
必填
system / user / assistant / tool。tool 消息用于回传工具执行结果。
messages[].content
string | array
必填
文本可直接传字符串;多模态输入传内容块数组。
messages[].content[].type
string
多模态
稳定示例为 text / image_url;video、input_audio 等百炼扩展内容块需按具体模型实测。
messages[].content[].text
string
多模态
type=text 时的文本。
messages[].content[].image_url.url
string
多模态
图片 URL 或 data URL,需模型支持视觉理解。
stream
boolean
可选
开启 SSE 流式输出。长文本、推理模型和交互场景建议开启。
stream_options.include_usage
boolean
可选
流式响应最后返回 usage。需要计费、统计或 smoke 校验时建议开启。
temperature
number
可选
采样温度。范围通常为 0 到 2;越高越随机。
top_p
number
可选
核采样阈值。建议不要和 temperature 同时大幅调整。
max_tokens
integer
可选
最大输出 token 数,不能超过模型 maxOutput。
stop
string | string[]
可选
停止序列,命中后结束输出。
presence_penalty
number
可选
存在惩罚,通常范围 -2 到 2,增加新话题倾向。
frequency_penalty
number
可选
频率惩罚,通常范围 -2 到 2,降低重复表达。
tools
array
可选
函数调用定义数组。支持工具调用的模型才会稳定返回 tool_calls。
tools[].type
string
工具
固定为 function。
tools[].function.name
string
工具
函数名。建议使用字母、数字和下划线。
tools[].function.description
string
工具
函数用途说明,影响模型选择工具的准确性。
tools[].function.parameters
object
工具
JSON Schema,描述函数入参。
tool_choice
string | object
可选
稳定支持 auto / none,或指定 {type:'function', function:{name}}。思考模式模型不建议强制工具。
response_format
object
可选
输出格式控制。常见值为 {"type":"text"} 或 {"type":"json_object"}。
enable_thinking
boolean
可选
思考模式开关。仅对已验证支持的混合思考模型可关闭;仅思考模型会忽略 false 并继续返回 reasoning_content。
thinking_budget
integer
可选
限制思考 Token 上限,按模型 ID 前缀透传(qwen3.7- / qwen3.6- / qwen3.5- / qwen3-)。
preserve_thinking
boolean
可选
将历史消息中的 reasoning_content 透传回模型,支持 qwen3.7-max、qwen3.6-max-preview、qwen3.6-plus、kimi-k2.6。
enable_search
boolean
可选
联网搜索,支持通义千问文本类模型(非 VL / math 系列)。
search_options
object
可选
联网搜索配置,与 enable_search 配套使用。
seed
integer
可选
随机种子,通义千问文本模型支持透传。
top_k
integer
可选
Top-K 采样,通义千问文本模型支持透传。
logprobs
boolean
可选
返回 log 概率,通义千问文本模型支持透传。
repetition_penalty
number
可选
重复惩罚,通义千问文本模型支持透传。
parallel_tool_calls
boolean
可选
并行工具调用,支持通义千问、DeepSeek、GLM、Anthropic 模型。

暂未支持的字段

下表列出目前公共 Chat 入口尚未稳定透传的字段;生产代码请勿依赖。

参数
类型/映射
状态
说明
max_completion_tokens
integer
暂未透传
请使用当前稳定支持的 max_tokens。

思考模式支持情况

这里列的是 NexusFlow 线上 OpenAI Chat 入口的实测行为。支持情况会随上游模型版本变化,生产代码应按模型 ID 做显式配置。

参数
类型/映射
状态
说明
qwen3.7-max
混合思考
支持 true / false
默认开启思考;true 返回 reasoning_content;false 不返回。支持 thinking_budget 和 preserve_thinking。
qwen3.5-flash
混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
qwen3-max
混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
qwq-plus
仅思考
false 不能关闭
线上验证:true/false 都返回 reasoning_content。
qwen-math-plus
未按思考开关处理
不要传
线上验证:true/false 都未返回 reasoning_content。
deepseek-r1
仅思考
false 不能关闭
线上验证:true/false 都返回 reasoning_content。
deepseek-v3.2
混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
deepseek-v4-pro
混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。
glm-5.1
混合思考
支持 true / false
线上验证:true 返回 reasoning_content;false 不返回。

Anthropic Messages 映射

参数
类型/映射
状态
model
model
模型 ID,映射到 OpenAI model。
system
messages[0].role=system
系统提示词。支持字符串或 text blocks。
messages
messages
user / assistant 消息会转换成 OpenAI 消息。
messages[].content[].text
messages[].content
文本块。纯文本块会合并为字符串。
messages[].content[].image
image_url
支持 url 或 base64 source,转换为 OpenAI image_url。
messages[].content[].tool_use
assistant.tool_calls
助手工具调用结果。
messages[].content[].tool_result
role=tool
工具执行结果回传。
max_tokens
max_tokens
最大输出 token。
temperature
temperature
采样温度。
top_p
top_p
核采样。
stop_sequences
stop
停止序列数组。
stream
stream
开启 Anthropic SSE 事件流。
tools
tools
Anthropic tools 会转换为 OpenAI function tools。
tool_choice
tool_choice
auto / none / any / tool 会转换为 OpenAI tool_choice。

Gemini GenerateContent 映射

参数
类型/映射
状态
contents
messages
消息数组。字符串 contents 也会被包装成 user 文本消息。
contents[].role
messages[].role
user 映射 user,model 映射 assistant。
contents[].parts[].text
content text
文本内容。
contents[].parts[].inlineData
image_url data URL
base64 图片内容,转换为 image_url。
contents[].parts[].fileData
image_url
文件 URL,转换为 image_url。
contents[].parts[].functionCall
assistant.tool_calls
模型函数调用。
contents[].parts[].functionResponse
role=tool
工具执行结果。
systemInstruction
system message
系统提示词,支持字符串或 parts。
generationConfig.temperature
temperature
采样温度。
generationConfig.topP
top_p
核采样。
generationConfig.maxOutputTokens
max_tokens
最大输出 token。
generationConfig.stopSequences
stop
停止序列数组。
tools[].functionDeclarations
tools
函数声明,转换为 OpenAI function tools。
toolConfig.functionCallingConfig.mode
tool_choice
AUTO / ANY / NONE 分别映射 auto / required / none;部分上游模型可能不接受 required。
streamGenerateContent
stream=true
流式接口。使用 ?alt=sse 时按 SSE 返回。

响应字段

参数
类型/映射
choices[].message.content
非流式文本输出。
choices[].message.reasoning_content
推理模型可能返回的思考内容字段。
choices[].message.tool_calls
模型请求调用工具时返回。
choices[].delta.content
流式文本增量。
choices[].delta.reasoning_content
流式思考增量,推理模型可能返回。
choices[].finish_reason
stop / length / tool_calls / content_filter。
usage.prompt_tokens
输入 token。
usage.completion_tokens
输出 token。
usage.total_tokens
总 token。
usage.completion_tokens_details.reasoning_tokens
推理 token,部分模型返回。
生产建议:推理模型使用 stream=truestream_options.include_usage=true;混合思考模型在低成本、低延迟场景显式传 enable_thinking=false。 更多例子见 对话补全 APIGemini 协议