nexusflow
在线
功能

多协议支持

使用熟悉的 SDK 直接接入同一网关,统一鉴权、统一计费、统一监控

nexusflow 当前对外统一提供三类 public protocol:OpenAI、Anthropic Messages 和 Gemini-compatible GenerateContent。 这些协议在平台内通过兼容层接到同一套模型路由、计费和监控链路上,目标是让你可以继续使用熟悉的 SDK,同时不把供应商差异泄漏到业务侧。 Gemini-compatible 表示请求/响应格式兼容,不代表平台托管 Google 原生 Gemini 模型。

支持的协议

协议端点前缀对应 SDK主要用途
OpenAI Chat Completions/v1/chat/completionsOpenAI SDK文本对话、工具调用
OpenAI Image Generations/v1/images/generationsOpenAI SDK图像生成
OpenAI Embeddings/v1/embeddingsOpenAI SDK文本向量化
Anthropic Messages/v1/messagesAnthropic SDK文本对话、工具调用
Gemini-compatible GenerateContent/v1beta/models/{model}:generateContentGoogle GenAI SDK / HTTP文本对话格式兼容

不是所有模型都支持所有协议。模型详情页会直接展示该模型当前可用的 supported_protocols

协议边界

NexusFlow 当前 public API 只列出可直接调用的兼容入口。模型详情页会展示每个模型实际开放的 supported_protocols。

协议 / 接口端点当前状态说明
OpenAI Chat Completions/v1/chat/completions已开放文本、推理、多模态、编程模型的默认推荐入口。
Anthropic Messages/v1/messages已开放兼容 Anthropic SDK 和 Messages 请求/流式事件格式。
Gemini-compatible GenerateContent/v1beta/models/{model}:generateContent已开放兼容 Google GenAI / Gemini GenerateContent 请求格式。
OpenAI Image Generations/v1/images/generations已开放图像生成的同步兼容入口;复杂图像/视频任务也可用 /v1/tasks。
OpenAI Embeddings/v1/embeddings已开放文本向量模型入口。
NexusFlow Tasks/v1/tasks已开放图像和视频异步任务统一入口。

参考:阿里云百炼 Qwen API Reference

OpenAI 协议

这是最通用的协议,大多数模型都支持。兼容 OpenAI Chat Completions API 规范。

基本配置

from openai import OpenAI

client = OpenAI(
    api_key="sk-air-your-key",
    base_url="https://nexusflow.hk/v1",
)

# 基本对话
response = client.chat.completions.create(
    model="qwen3-max",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

流式输出

stream = client.chat.completions.create(
    model="qwen3-max",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

图像生成

支持 openai:image-generations 协议的模型可以通过 OpenAI SDK 生成图像。

response = client.images.generate(
    model="wan2.6-t2i",
    prompt="A futuristic city at sunset, cyberpunk style",
    size="1024x1024",
    n=1,
)
print(response.data[0].url)

文本向量化

支持 openai:embeddings 协议的模型可以将文本转为向量表示,用于语义搜索、聚类、RAG 等场景。

response = client.embeddings.create(
    model="text-embedding-v4",
    input="Your text string goes here",
)
print(response.data[0].embedding[:5])

Anthropic 协议

提供 Anthropic Messages 兼容入口,便于使用 Anthropic SDK 直接接入 nexusflow 的统一模型网关。

基本配置

import anthropic

client = anthropic.Anthropic(
    api_key="sk-air-your-key",
    base_url="https://nexusflow.hk",
)

message = client.messages.create(
    model="qwen3-max",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)
print(message.content[0].text)

流式输出

with client.messages.stream(
    model="qwen3-max",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}],
) as stream:
    for text in stream.text_stream:
        print(text, end="")

Gemini-compatible 协议

提供 Google GenAI 风格的 /v1beta/models/{model}:generateContent 兼容入口, 适合需要沿用 Gemini SDK 的场景。路径中的 model 是 NexusFlow 模型 ID, 例如 qwen-turbo,不是 Google 原生 Gemini 模型名。 当前以 generateContentstreamGenerateContent 为主。

from google import genai
from google.genai import types

client = genai.Client(
    api_key="sk-air-your-key",
    http_options=types.HttpOptions(
        api_version="v1beta",
        base_url="https://nexusflow.hk",
    ),
)

response = client.models.generate_content(
    model="qwen-turbo",
    contents="Hello!",
)
print(response.text)

协议选择建议

1.如果你使用的是 DeepSeek、Qwen、GLM 等国产模型,推荐使用 OpenAI 协议,兼容性最好。
2.如果你已经在用 Anthropic SDK,可以优先使用 /v1/messages,减少 SDK 迁移成本。
3.如果你的应用已经基于 Google GenAI SDK,可以使用 /v1beta/models/{model}:generateContent,但 model 仍然填写 NexusFlow 模型 ID。
4.在模型详情页查看 supported_protocols,确认该模型当前开放了哪些协议。

相关文档