nexusflow
在线
Anthropic Messages API

Anthropic Messages API 接入

NexusFlow 的 /v1/messages 与官方 Anthropic Messages API 完全协议兼容, 可直接用 Anthropic 官方 SDK(anthropic Python / @anthropic-ai/sdk)调用。 除 claude-* 模型直连 Anthropic 官方端点外,其余模型透传至阿里云百炼 Anthropic 兼容端点, 原生 SSE 事件流、thinking 思考块、tool_use 工具调用、显式缓存(cache_control)等特性全部保留。

从 Anthropic 迁移? 只需改两行配置:
  • api_key → 替换为 NexusFlow API Key(控制台创建)
  • base_urlhttps://nexusflow.hk
  • model → 选择目标模型(完整列表见 模型列表)

接口地址

POSThttps://nexusflow.hk/v1/messages同步 / 流式

请求头

名称取值必选说明
x-api-key<API_KEY>API 密钥。可与 Authorization 二选一,在控制台创建后以 sk-air- 开头。
AuthorizationBearer <API_KEY>API 密钥(Bearer 形式)。可与 x-api-key 二选一。
anthropic-version2023-06-01Anthropic API 版本号,与官方 Anthropic SDK 兼容。
Content-Typeapplication/json请求体格式,固定为 JSON。
鉴权:x-api-keyAuthorization: Bearer 二选一即可。

请求参数

参数类型必选说明
modelstring模型 ID。例如 qwen3.7-plus、claude-sonnet-4-6、deepseek-v4-pro 等。 (查看)
max_tokensinteger回复内容的最大 Token 数。若生成内容超过此值,生成将提前停止,stop_reason 为 max_tokens。max_tokens 不限制思考过程的长度,思考长度由 thinking.budget_tokens 单独控制。
messagesarray消息数组,按 user / assistant 交替排列。content 可以是字符串或结构化内容数组(text / image / video / tool_use / tool_result)。
systemstring | array系统提示词。可以是字符串或文本块数组。需要标记显式缓存断点时必须传入数组形式,在 text 块上添加 cache_control。
streamboolean是否启用流式输出,默认 false。开启后以 SSE 事件流形式返回 message_start / content_block_delta / message_delta / message_stop 等事件。
temperaturenumber采样温度,取值范围 [0, 2)。值越大,生成结果越随机。该范围与 Anthropic 官方 [0, 1] 不同,从 Anthropic 迁移时请确认取值。
top_pnumber核采样的概率阈值,控制生成多样性。temperature 与 top_p 建议只设置其中一个。
top_kinteger采样候选集的大小。
stop_sequencesarray停止序列。模型生成到该序列前会停止输出,且不包含序列本身。命中后 stop_reason 仍为 end_turn。
thinkingobject深度思考配置。type=enabled 开启思考(响应将包含 thinking 类型内容块),disabled 关闭。budget_tokens 限制思考阶段最大 Token 数,与 max_tokens 互不重叠。
toolsarray工具定义数组,每个工具包含 name / description / input_schema(JSON Schema)。
tool_choiceobject工具选择策略:{"type":"auto"} 自由选择(默认)、{"type":"any"} 强制调用任意工具、{"type":"none"} 禁止调用、{"type":"tool","name":"xxx"} 强制指定工具。
reasoning_effortstring推理强度,可选 high / max,默认 max。仅 deepseek-v4-pro / deepseek-v4-flash 等模型支持。
除上表外,百炼 Anthropic 兼容端点支持的其他扩展参数(如 preserve_thinking)同样可直接透传,具体支持以模型为准。 兼容性:也接受 OpenAI 风格的 enable_thinking / thinking_budget,会自动映射为 Anthropic 风格的 thinking 对象。

调用示例

curl -X POST https://nexusflow.hk/v1/messages \
  -H "x-api-key: $NEXUSFLOW_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "max_tokens": 1024,
    "system": "You are a helpful assistant",
    "messages": [
      {"role": "user", "content": "你是谁?"}
    ],
    "thinking": {"type": "disabled"}
  }'

响应字段(非流式)

字段类型说明
idstring消息的唯一标识,如 msg_xxx。NexusFlow 会以本平台 logId 重写顶层 id 用于审计追踪。
typestring固定为 "message"。
rolestring固定为 "assistant"。
modelstring实际使用的模型名称。
contentarray内容数组,元素 type 可能为 text、thinking(开启思考时)、tool_use(Function Call)。
stop_reasonstring停止原因:end_turn(自然结束)、max_tokens(达到上限)、tool_use(调用工具)、stop_sequence(命中停止序列)。
stop_sequencestring | null通常为 null。
usage.input_tokensinteger输入 Token 数(不含 cache_creation_input_tokens 与 cache_read_input_tokens 的部分)。
usage.output_tokensinteger输出 Token 数。
usage.cache_creation_input_tokensinteger本次创建显式缓存所消耗的输入 Token 数(按 1.25× 输入价格计费)。
usage.cache_read_input_tokensinteger本次命中显式缓存所读取的 Token 数(按 0.1× 输入价格计费)。

流式事件(stream=true)

事件说明
message_start流的第一个事件,标记消息开始。message.usage 为上游初值,只含 input_tokens 和 output_tokens。
content_block_start每个内容块开始时发送。content_block.type 可能为 text、thinking、tool_use。
content_block_delta内容块的增量。delta.type 为 text_delta / thinking_delta / signature_delta / input_json_delta(工具调用入参)之一。
content_block_stop内容块结束。
message_delta消息级更新,在所有内容块结束后发送。包含 stop_reason 与完整的 usage(4 字段:input_tokens / output_tokens / cache_creation_input_tokens / cache_read_input_tokens)。计费以此事件为准。
message_stop流的最后一个事件,标记消息结束。
ping保持连接活跃的心跳事件,客户端可忽略。
计费提示:流式响应中 message_start.usage 由上游给出初值,仅含 input_tokensoutput_tokens; 完整 4 字段(含 cache_creation_input_tokenscache_read_input_tokens)在 message_delta 事件中返回, NexusFlow 计费以 message_delta 为准。

与百炼/Anthropic 官方端点的关系

NexusFlow /v1/messages 实行协议对等透传:
  • claude-* 模型 → 直连 https://api.anthropic.com/v1/messages(Anthropic 官方)。
  • 其余模型 → 转发至 https://dashscope.aliyuncs.com/apps/anthropic/v1/messages(百炼 Anthropic 兼容端点)。
请求体原样转发,响应原样回传(仅顶层 id 改写为本平台 logId 用于审计追踪)。thinkingtoolscache_control、图片/视频内容块、tool_use 工具调用块等所有特性均由上游处理,与官方协议保持一致。

注意事项

  • max_tokens 为必填,不设置请求会报错。不限制思考过程长度,思考阶段长度由 thinking.budget_tokens 单独控制。
  • temperature 在百炼端取值范围为 [0, 2),与 Anthropic 官方的 [0, 1] 不同;从 Anthropic 迁移时请确认取值。
  • 显式缓存(cache_control: ephemeral)最小可缓存长度为 1024 token,缓存创建按 1.25× 输入价计费,命中按 0.1× 计费。
  • 图片 / 视频输入需使用视觉模型(如 qwen3-vl-plusqwen-vl-max),通过 content 数组传入 image / video 块。
  • 开启思考(thinking.type=enabled)的模型在响应中会包含 type=thinking 内容块,客户端需要按 type 区分渲染。
  • 计费、限流、余额检查、显式缓存折扣等均按上游真实 usage(message_delta 事件 / 非流响应 usage)结算。
模型列表
查看所有可用模型与能力矩阵
OpenAI Chat
OpenAI 兼容端点(/v1/chat/completions)
上下文缓存
显式缓存使用与计费规则
参数矩阵
各模型参数支持情况
错误码
错误码说明与排查指南
定价
完整定价信息