功能

多协议支持

使用熟悉的 SDK 直接接入同一网关，统一鉴权、统一计费、统一监控

nexusflow 当前对外统一提供三类 public protocol：OpenAI Chat Completions、Anthropic Messages 和 Responses API。这些协议在平台内通过兼容层接到同一套模型路由、计费和监控链路上，目标是让你可以继续使用熟悉的 SDK，同时不把供应商差异泄漏到业务侧。 Responses API 提供内置工具（联网搜索、代码解释器等）和 previous_response_id 多轮上下文管理，适合复杂任务场景。

⚠ 协议支持范围

/v1/chat/completions

全部模型支持

/v1/messages

全部模型支持

/v1/responses — 仅通义千问系列支持； DeepSeek / GLM / Kimi / MiniMax 调用会返回 Unsupported model，请改用前两个端点。

支持的协议

协议	端点前缀	对应 SDK	主要用途
OpenAI Chat Completions	`/v1/chat/completions`	OpenAI SDK	文本对话、工具调用
OpenAI Image Generations	`/v1/images/generations`	OpenAI SDK	图像生成
OpenAI Embeddings	`/v1/embeddings`	OpenAI SDK	文本向量化
Anthropic Messages	`/v1/messages`	Anthropic SDK	文本对话、工具调用
Responses API	`/v1/responses`	OpenAI SDK	内置工具、多轮上下文

不是所有模型都支持所有协议。模型详情页会直接展示该模型当前开放的 supported_protocols；调用前还应确认 availability 为 available。

协议边界

NexusFlow 当前 public API 只列出兼容入口；目录中的模型可能因上游凭据或健康状态临时不可用。模型详情页会同时展示 supported_protocols 和 availability。

协议 / 接口	端点	当前状态	说明
OpenAI Chat Completions	`/v1/chat/completions`	已开放	文本、推理、多模态、编程模型的默认推荐入口。
Anthropic Messages	`/v1/messages`	已开放	兼容 Anthropic SDK 和 Messages 请求/流式事件格式。
Responses API	`/v1/responses`	已开放	内置联网搜索、代码解释器等工具，简化多轮对话上下文管理。
OpenAI Image Generations	`/v1/images/generations`	已开放	图像生成的同步兼容入口；复杂图像/视频任务也可用 /v1/tasks。
OpenAI Embeddings	`/v1/embeddings`	已开放	文本向量模型入口。
NexusFlow Tasks	`/v1/tasks`	已开放	图像和视频异步任务统一入口。

参考：OpenAI Chat Completions API Reference。

OpenAI 协议

这是最通用的协议，大多数模型都支持。兼容 OpenAI Chat Completions API 规范。

基本配置

from openai import OpenAI

client = OpenAI(
    api_key="sk-air-your-key",
    base_url="https://nexusflow.hk/v1",
)

# 基本对话
response = client.chat.completions.create(
    model="qwen3-max",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

流式输出

stream = client.chat.completions.create(
    model="qwen3-max",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

图像生成

支持 openai:image-generations 协议的模型可以通过 OpenAI SDK 生成图像。

response = client.images.generate(
    model="wan2.6-t2i",
    prompt="A futuristic city at sunset, cyberpunk style",
    size="1024x1024",
    n=1,
)
print(response.data[0].url)

文本向量化

支持 openai:embeddings 协议的模型可以将文本转为向量表示，用于语义搜索、聚类、RAG 等场景。

response = client.embeddings.create(
    model="text-embedding-v4",
    input="Your text string goes here",
)
print(response.data[0].embedding[:5])

Anthropic 协议

提供 Anthropic Messages 兼容入口，便于使用 Anthropic SDK 直接接入 nexusflow 的统一模型网关。

基本配置

import anthropic

client = anthropic.Anthropic(
    api_key="sk-air-your-key",
    base_url="https://nexusflow.hk",
)

message = client.messages.create(
    model="qwen3-max",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content[0].text)

流式输出

with client.messages.stream(
    model="qwen3-max",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}],
) as stream:
    for text in stream.text_stream:
        print(text, end="")

Responses API

Responses API 相较于 Chat Completions 提供了更强大的能力：内置联网搜索、网页抓取、代码解释器等工具；通过 previous_response_id 简化多轮对话上下文管理，无需手动构建完整消息历史。使用 OpenAI SDK 的 client.responses.create() 即可调用。

基本调用

from openai import OpenAI

client = OpenAI(
    api_key="sk-air-your-key",
    base_url="https://nexusflow.hk/v1",
)

# 基本调用
response = client.responses.create(
    model="qwen3.7-plus",
    input="你好！"
)
print(response.output_text)

内置工具

# 使用内置工具
response = client.responses.create(
    model="qwen3.7-plus",
    input="帮我搜索今天的新闻",
    tools=[
        {"type": "web_search"},
        {"type": "code_interpreter"},
        {"type": "web_extractor"},
    ],
)
print(response.output_text)

多轮对话

# 多轮对话 — 通过 previous_response_id 关联上下文
response1 = client.responses.create(
    model="qwen3.7-plus",
    input="我叫张三"
)

response2 = client.responses.create(
    model="qwen3.7-plus",
    input="你还记得我的名字吗？",
    previous_response_id=response1.id
)
print(response2.output_text)

协议选择建议

1.如果你使用的是 DeepSeek、Qwen、GLM 等国产模型，推荐使用 OpenAI Chat 协议，兼容性最好。

2.如果你已经在用 Anthropic SDK，可以优先使用 /v1/messages，减少 SDK 迁移成本。

3.如果你需要内置工具（联网搜索、代码解释器）或 previous_response_id 多轮上下文，使用 /v1/responses。

4.在模型详情页查看 supported_protocols，确认该模型当前开放了哪些协议。

多协议支持

支持的协议

协议边界

OpenAI 协议

基本配置

流式输出

图像生成

文本向量化

Anthropic 协议

基本配置

流式输出

Responses API

基本调用

内置工具

多轮对话

协议选择建议

相关文档