Claude Messages API

Claude API 接入

NexusFlow 的 /v1/messages 同时支持 Anthropic 原生 Claude 模型和兼容层模型。当 model 为 claude-* 时，请求会直连 Anthropic 官方 Messages API，并保留原生响应与 SSE 事件格式。

✓ 协议支持范围

/v1/messages 支持 NexusFlow 接入的全部模型 — 包含 Claude 官方系列，以及通义千问、GLM、DeepSeek、Kimi、MiniMax 等。

接口地址

POSThttps://nexusflow.hk/v1/messages同步 / 流式

请求参数

参数	必选	说明
`model`	是	Claude 模型 ID，例如 claude-sonnet-4-6、claude-opus-4-7
`messages`	是	Anthropic Messages 格式消息数组
`max_tokens`	是	最大输出 token 数
`stream`	否	设为 true 时返回 Anthropic SSE 事件流
`system`	否	系统提示词，使用 Anthropic 顶层 system 字段
`tools`	否	Anthropic 工具定义；Claude 模型会原样转发给官方 API

支持模型与官方价格

模型	上下文	最大输出	USD / MTok 输入/输出
`claude-opus-4-7`	1M	128K	$5 / $25
`claude-sonnet-4-6`	1M	64K	$3 / $15
`claude-haiku-4-5`	200K	64K	$1 / $5

调用示例

curl https://nexusflow.hk/v1/messages \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "用三句话解释什么是模型网关"}
    ]
  }'

curl https://nexusflow.hk/v1/messages \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-haiku-4-5",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
      {"role": "user", "content": "写一段产品发布文案"}
    ]
  }'

Prompt Caching（上下文缓存）

通过 /v1/messages 调用时支持 Prompt Caching。在 system 或 messages 的 content block 上添加 cache_control 注解，重复前缀将被缓存，后续请求命中缓存部分享受 90% 折扣：

Token 类型计费倍率说明

cache_creation_input_tokens1.25x首次写入缓存

cache_read_input_tokens0.1x命中缓存，90% 折扣

input_tokens1x未缓存部分，正常计费

用法示例：在 system 块上添加 "cache_control": {"type": "ephemeral"}。适用于长 system prompt、文档上下文等重复内容。所有 /v1/messages 协议下的模型均支持。