通义千问 / Qwen

Qwen 系列模型 API

Qwen 文本、推理、视觉理解和编程模型可通过 NexusFlow 的三类公共兼容协议调用：OpenAI Chat Completions、Anthropic Messages、Responses API。下方请求示例默认使用 OpenAI Chat，因为它覆盖能力最完整、迁移成本最低。

协议与端点

协议	端点	状态	说明
OpenAI Chat Completions	`/v1/chat/completions`	已开放	默认示例入口，支持 OpenAI SDK、流式输出、工具调用、视觉输入和推理字段。
Anthropic Messages	`/v1/messages`	已开放	适合复用 Anthropic SDK 或 Messages 格式；model 仍填写 NexusFlow 的 Qwen 模型 ID。
Responses API	`/v1/responses`	已开放	内置联网搜索、代码解释器等工具，支持 previous_response_id 多轮上下文。

本页展示当前 NexusFlow 公共网关已开放、可直接调用的协议。

可用模型

模型 ID	上下文	首阶输入 (¥/1M tokens)	首阶输出 (¥/1M tokens)
`qwen3.7-max`	1M	¥12/M	¥36/M
`qwen3-max`	256K	¥2.5/M	¥10/M
`qwen3.6-max-preview`	256K	¥9/M	¥54/M
`qwen3.6-plus`	1M	¥2/M	¥12/M
`qwen3.6-flash`	1M	¥1.2/M	¥7.2/M
`qwen3.5-plus`	1M	¥0.8/M	¥4.8/M
`qwen3.5-flash`	1M	¥0.2/M	¥2/M
`qwen-plus`	1M	¥0.8/M	¥2/M
`qwen-turbo`	1M	¥0.3/M	¥0.6/M

价格为每 100 万 tokens 的人民币价格。同一模型 ID 可按上方已开放协议调用；不同协议共享同一套余额、计费和监控。

请求示例

curl -X POST 'https://nexusflow.hk/v1/chat/completions' \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-max",
    "messages": [
      {"role": "system", "content": "你是一个有帮助的助手。"},
      {"role": "user", "content": "简要介绍一下量子计算的基本原理"}
    ],
    "temperature": 0.7,
    "max_tokens": 2000
  }'

三协议 cURL 示例

Qwen 文本类模型在 NexusFlow 中共享同一套模型 ID、API Key、余额、用量和扣费记录。下面三个示例均可直接请求公开网关。

OpenAI Chat Completions/v1/chat/completions

curl -X POST 'https://nexusflow.hk/v1/chat/completions' \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-flash",
    "messages": [
      {"role": "user", "content": "只回复 OK"}
    ],
    "max_tokens": 8
  }'

Anthropic Messages/v1/messages

curl -X POST 'https://nexusflow.hk/v1/messages' \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-flash",
    "max_tokens": 8,
    "messages": [
      {"role": "user", "content": "只回复 OK"}
    ]
  }'

Responses API/v1/responses

curl https://nexusflow.hk/v1/responses \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-flash",
    "input": "只回复 OK"
  }'

响应示例

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "qwen3-max",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "量子计算是一种利用量子力学原理进行信息处理的计算方式..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 42,
    "completion_tokens": 618,
    "total_tokens": 660
  }
}

特殊参数

思考模式参数 — enable_thinking 只对支持思考开关的模型有意义；仅思考模型无法关闭，数学专用模型不要默认传该参数。

参数	类型	适用模型	说明
`enable_thinking`	boolean	见下表	混合思考模型传 true 会返回 reasoning_content，传 false 可降低延迟和输出 token；仅思考模型会继续返回 reasoning_content。

模型	线上实测行为	建议
`qwen3.5-flash`	true 返回 reasoning_content；false 不返回	低成本场景显式传 false
`qwen3-max`	true 返回 reasoning_content；false 不返回	复杂任务传 true，普通对话传 false
`qwq-plus`	true/false 都返回 reasoning_content	按仅思考模型使用，不要指望 false 关闭
`qwen-math-plus`	true/false 均未返回 reasoning_content	不要默认传 enable_thinking

启用思考模式的响应示例

{
  "id": "chatcmpl-thinking-xyz",
  "object": "chat.completion",
  "model": "qwq-plus",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "水池注满需要约 14.29 小时。",
        "reasoning_content": "让我分析这道题：\n进水速率 = 3 + 2 = 5 吨/小时\n出水速率 = 1.5 吨/小时\n净进水速率 = 5 - 1.5 = 3.5 吨/小时\n注满时间 = 50 / 3.5 ≈ 14.29 小时"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 68,
    "completion_tokens": 1024,
    "total_tokens": 1092
  }
}

快速开始

5 分钟完成首次 API 调用

多协议接入

查看 OpenAI / Anthropic / Responses 兼容说明

Chat Completions

查看默认对话接口文档