Anthropic Messages API
Anthropic Messages API 接入
NexusFlow 的 /v1/messages 与官方 Anthropic Messages API 完全协议兼容, 可直接用 Anthropic 官方 SDK(anthropic Python / @anthropic-ai/sdk)调用。 除 claude-* 模型直连 Anthropic 官方端点外,其余模型透传至阿里云百炼 Anthropic 兼容端点, 原生 SSE 事件流、thinking 思考块、tool_use 工具调用、显式缓存(cache_control)等特性全部保留。
接口地址
POST
https://nexusflow.hk/v1/messages同步 / 流式请求头
鉴权:
x-api-key 与 Authorization: Bearer 二选一即可。请求参数
除上表外,百炼 Anthropic 兼容端点支持的其他扩展参数(如
preserve_thinking)同样可直接透传,具体支持以模型为准。 兼容性:也接受 OpenAI 风格的 enable_thinking / thinking_budget,会自动映射为 Anthropic 风格的 thinking 对象。调用示例
响应字段(非流式)
流式事件(stream=true)
计费提示:流式响应中
message_start.usage 由上游给出初值,仅含 input_tokens 和 output_tokens; 完整 4 字段(含 cache_creation_input_tokens、cache_read_input_tokens)在 message_delta 事件中返回, NexusFlow 计费以 message_delta 为准。与百炼/Anthropic 官方端点的关系
NexusFlow
/v1/messages 实行协议对等透传:claude-*模型 → 直连https://api.anthropic.com/v1/messages(Anthropic 官方)。- 其余模型 → 转发至
https://dashscope.aliyuncs.com/apps/anthropic/v1/messages(百炼 Anthropic 兼容端点)。
id 改写为本平台 logId 用于审计追踪)。thinking、tools、cache_control、图片/视频内容块、tool_use 工具调用块等所有特性均由上游处理,与官方协议保持一致。注意事项
max_tokens为必填,不设置请求会报错。不限制思考过程长度,思考阶段长度由thinking.budget_tokens单独控制。temperature在百炼端取值范围为 [0, 2),与 Anthropic 官方的 [0, 1] 不同;从 Anthropic 迁移时请确认取值。- 显式缓存(
cache_control: ephemeral)最小可缓存长度为 1024 token,缓存创建按 1.25× 输入价计费,命中按 0.1× 计费。 - 图片 / 视频输入需使用视觉模型(如
qwen3-vl-plus、qwen-vl-max),通过content数组传入image/video块。 - 开启思考(
thinking.type=enabled)的模型在响应中会包含type=thinking内容块,客户端需要按 type 区分渲染。 - 计费、限流、余额检查、显式缓存折扣等均按上游真实
usage(message_delta事件 / 非流响应usage)结算。
模型列表
查看所有可用模型与能力矩阵
OpenAI Chat
OpenAI 兼容端点(/v1/chat/completions)
上下文缓存
显式缓存使用与计费规则
参数矩阵
各模型参数支持情况
错误码
错误码说明与排查指南
定价
完整定价信息