功能
多协议支持 使用熟悉的 SDK 直接接入同一网关,统一鉴权、统一计费、统一监控
nexusflow 当前对外统一提供三类 public protocol:OpenAI、Anthropic Messages 和 Gemini-compatible GenerateContent。 这些协议在平台内通过兼容层接到同一套模型路由、计费和监控链路上,目标是让你可以继续使用熟悉的 SDK,同时不把供应商差异泄漏到业务侧。 Gemini-compatible 表示请求/响应格式兼容,不代表平台托管 Google 原生 Gemini 模型。
支持的协议 协议 端点前缀 对应 SDK 主要用途 OpenAI Chat Completions /v1/chat/completionsOpenAI SDK 文本对话、工具调用 OpenAI Image Generations /v1/images/generationsOpenAI SDK 图像生成 OpenAI Embeddings /v1/embeddingsOpenAI SDK 文本向量化 Anthropic Messages /v1/messagesAnthropic SDK 文本对话、工具调用 Gemini-compatible GenerateContent /v1beta/models/{model}:generateContentGoogle GenAI SDK / HTTP 文本对话格式兼容
不是所有模型都支持所有协议。模型详情页会直接展示该模型当前可用的 supported_protocols。
协议边界 NexusFlow 当前 public API 只列出可直接调用的兼容入口。模型详情页会展示每个模型实际开放的 supported_protocols。
协议 / 接口 端点 当前状态 说明 OpenAI Chat Completions /v1/chat/completions已开放 文本、推理、多模态、编程模型的默认推荐入口。 Anthropic Messages /v1/messages已开放 兼容 Anthropic SDK 和 Messages 请求/流式事件格式。 Gemini-compatible GenerateContent /v1beta/models/{model}:generateContent已开放 兼容 Google GenAI / Gemini GenerateContent 请求格式。 OpenAI Image Generations /v1/images/generations已开放 图像生成的同步兼容入口;复杂图像/视频任务也可用 /v1/tasks。 OpenAI Embeddings /v1/embeddings已开放 文本向量模型入口。 NexusFlow Tasks /v1/tasks已开放 图像和视频异步任务统一入口。
参考:阿里云百炼 Qwen API Reference 。
OpenAI 协议 这是最通用的协议,大多数模型都支持。兼容 OpenAI Chat Completions API 规范。
基本配置 Python Node.js
复制 from openai import OpenAI
client = OpenAI(
api_key="sk-air-your-key",
base_url="https://nexusflow.hk/v1",
)
# 基本对话
response = client.chat.completions.create(
model="qwen3-max",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)流式输出 复制 stream = client.chat.completions.create(
model="qwen3-max",
messages=[{"role": "user", "content": "Hello!"}],
stream=True,
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")图像生成 支持 openai:image-generations 协议的模型可以通过 OpenAI SDK 生成图像。
复制 response = client.images.generate(
model="wan2.6-t2i",
prompt="A futuristic city at sunset, cyberpunk style",
size="1024x1024",
n=1,
)
print(response.data[0].url)文本向量化 支持 openai:embeddings 协议的模型可以将文本转为向量表示,用于语义搜索、聚类、RAG 等场景。
复制 response = client.embeddings.create(
model="text-embedding-v4",
input="Your text string goes here",
)
print(response.data[0].embedding[:5])Anthropic 协议 提供 Anthropic Messages 兼容入口,便于使用 Anthropic SDK 直接接入 nexusflow 的统一模型网关。
基本配置 Python Node.js
复制 import anthropic
client = anthropic.Anthropic(
api_key="sk-air-your-key",
base_url="https://nexusflow.hk",
)
message = client.messages.create(
model="qwen3-max",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content[0].text)流式输出 复制 with client.messages.stream(
model="qwen3-max",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello!"}],
) as stream:
for text in stream.text_stream:
print(text, end="")Gemini-compatible 协议 提供 Google GenAI 风格的 /v1beta/models/{model}:generateContent 兼容入口, 适合需要沿用 Gemini SDK 的场景。路径中的 model 是 NexusFlow 模型 ID, 例如 qwen-turbo,不是 Google 原生 Gemini 模型名。 当前以 generateContent 与 streamGenerateContent 为主。
复制 from google import genai
from google.genai import types
client = genai.Client(
api_key="sk-air-your-key",
http_options=types.HttpOptions(
api_version="v1beta",
base_url="https://nexusflow.hk",
),
)
response = client.models.generate_content(
model="qwen-turbo",
contents="Hello!",
)
print(response.text)协议选择建议 1. 如果你使用的是 DeepSeek、Qwen、GLM 等国产模型,推荐使用 OpenAI 协议,兼容性最好。
2. 如果你已经在用 Anthropic SDK,可以优先使用 /v1/messages,减少 SDK 迁移成本。
3. 如果你的应用已经基于 Google GenAI SDK,可以使用 /v1beta/models/{model}:generateContent,但 model 仍然填写 NexusFlow 模型 ID。
4. 在模型详情页查看 supported_protocols,确认该模型当前开放了哪些协议。