nexusflow
在线
通义千问 / Qwen

Qwen 系列模型 API

Qwen 文本、推理、视觉理解和编程模型可通过 NexusFlow 的三类公共兼容协议调用:OpenAI Chat Completions、Anthropic Messages、Gemini-compatible GenerateContent。下方请求示例默认使用 OpenAI Chat,因为它覆盖能力最完整、迁移成本最低。

协议与端点

协议端点状态说明
OpenAI Chat Completions/v1/chat/completions已开放默认示例入口,支持 OpenAI SDK、流式输出、工具调用、视觉输入和推理字段。
Anthropic Messages/v1/messages已开放适合复用 Anthropic SDK 或 Messages 格式;model 仍填写 NexusFlow 的 Qwen 模型 ID。
Gemini-compatible GenerateContent/v1beta/models/{model}:generateContent已开放适合已有 Google GenAI / Gemini HTTP 调用迁移;路径里的 model 是 NexusFlow 模型 ID。

百炼官方 API 参考见 阿里云 Qwen API Reference。本页只展示当前 NexusFlow 公共网关已开放、可直接调用的协议。

可用模型

模型 ID上下文首阶输入 (¥/1M tokens)首阶输出 (¥/1M tokens)
qwen3.7-max1M¥12/M¥36/M
qwen3-max262K¥2.5/M¥10/M
qwen3.6-max-preview262K¥9/M¥54/M
qwen3.6-plus1M¥2/M¥12/M
qwen3.6-flash1M¥1.2/M¥7.2/M
qwen3.5-plus1M¥0.8/M¥4.8/M
qwen3.5-flash1M¥0.2/M¥2/M
qwen-plus1M¥0.8/M¥2/M
qwen-turbo1M¥0.3/M¥0.6/M

价格为每 100 万 tokens 的人民币价格。同一模型 ID 可按上方已开放协议调用;不同协议共享同一套余额、计费和监控。

请求示例

curl -X POST 'https://nexusflow.hk/v1/chat/completions' \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-max",
    "messages": [
      {"role": "system", "content": "你是一个有帮助的助手。"},
      {"role": "user", "content": "简要介绍一下量子计算的基本原理"}
    ],
    "temperature": 0.7,
    "max_tokens": 2000
  }'

三协议 cURL 示例

Qwen 文本类模型在 NexusFlow 中共享同一套模型 ID、API Key、余额、用量和扣费记录。下面三个示例均可直接请求公开网关。

OpenAI Chat Completions/v1/chat/completions
curl -X POST 'https://nexusflow.hk/v1/chat/completions' \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-flash",
    "messages": [
      {"role": "user", "content": "只回复 OK"}
    ],
    "max_tokens": 8
  }'
Anthropic Messages/v1/messages
curl -X POST 'https://nexusflow.hk/v1/messages' \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-flash",
    "max_tokens": 8,
    "messages": [
      {"role": "user", "content": "只回复 OK"}
    ]
  }'
Gemini-compatible GenerateContent/v1beta/models/qwen3.5-flash:generateContent
curl -X POST 'https://nexusflow.hk/v1beta/models/qwen3.5-flash:generateContent' \
  -H "x-goog-api-key: $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [{"text": "只回复 OK"}]
      }
    ],
    "generationConfig": {
      "maxOutputTokens": 8
    }
  }'

响应示例

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "qwen3-max",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "量子计算是一种利用量子力学原理进行信息处理的计算方式..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 42,
    "completion_tokens": 618,
    "total_tokens": 660
  }
}

特殊参数

思考模式参数enable_thinking 只对支持思考开关的模型有意义;仅思考模型无法关闭,数学专用模型不要默认传该参数。
参数类型适用模型说明
enable_thinkingboolean见下表混合思考模型传 true 会返回 reasoning_content,传 false 可降低延迟和输出 token;仅思考模型会继续返回 reasoning_content。
模型线上实测行为建议
qwen3.5-flashtrue 返回 reasoning_content;false 不返回低成本场景显式传 false
qwen3-maxtrue 返回 reasoning_content;false 不返回复杂任务传 true,普通对话传 false
qwq-plustrue/false 都返回 reasoning_content按仅思考模型使用,不要指望 false 关闭
qwen-math-plustrue/false 均未返回 reasoning_content不要默认传 enable_thinking

启用思考模式的响应示例

{
  "id": "chatcmpl-thinking-xyz",
  "object": "chat.completion",
  "model": "qwq-plus",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "水池注满需要约 14.29 小时。",
        "reasoning_content": "让我分析这道题:\n进水速率 = 3 + 2 = 5 吨/小时\n出水速率 = 1.5 吨/小时\n净进水速率 = 5 - 1.5 = 3.5 吨/小时\n注满时间 = 50 / 3.5 ≈ 14.29 小时"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 68,
    "completion_tokens": 1024,
    "total_tokens": 1092
  }
}
快速开始
5 分钟完成首次 API 调用
多协议接入
查看 OpenAI / Anthropic / Gemini 兼容说明
Chat Completions
查看默认对话接口文档