功能

供应商路由

同一模型的多供应商智能路由与自动容错

nexusflow 为同一模型配置了多个供应商端点。系统会根据各端点的实时表现智能选择最优端点，并在供应商不可用时自动切换，整个过程对调用方完全透明。

智能路由

当你发起 API 请求时，系统会根据模型 ID 和请求协议筛选出所有匹配的供应商端点，并综合端点的稳定性、延迟等因素选择最优端点。当某个端点出现异常时，系统会自动降低其优先级；恢复后自动回到正常位置，无需人工干预。

┌──────────────┐     ┌─────────────────┐     ┌──────────────────┐
│  Client      │────▶│  nexusflow      │────▶│  供应商 A (主)    │
│  POST /v1/   │     │  智能路由        │     │  通义千问         │
│  chat/compl  │     │                 │     └──────────────────┘
└──────────────┘     │  健康检测        │     ┌──────────────────┐
                     │  延迟监控        │────▶│  供应商 B (备)    │
                     │  自动切换        │     │  (可扩展)        │
                     └─────────────────┘     └──────────────────┘

健康检测

定时检测上游端点状态，连续失败自动标记为 degraded / down。

加权选择

综合端点优先级和权重进行负载均衡，健康端点优先使用。

透明恢复

故障端点恢复后自动回到正常优先级，无需人工干预。

自动容错

当选中的端点返回服务端错误（5xx）或限流（429）时，系统会自动重试下一个可用端点，直到请求成功或所有端点都已尝试。400 类客户端错误不会触发重试。

端点状态	条件	行为
`healthy`	连续成功	正常使用，最高优先级
`degraded`	出现失败且连续失败 < 10 次	降低优先级，仍可被选择
`down`	连续失败 >= 10 次	跳过该端点，不再尝试

注意事项

流式请求

如果端点在开始返回数据之前就失败了，系统可以无感地切换到下一个端点。但一旦数据已经开始发送给客户端，就无法再切换端点，错误会直接透传给客户端。

建议在客户端实现流式请求的错误处理逻辑，以应对流中断的情况。

协议不一致

容错能力取决于该模型在当前请求协议下有多少个可用端点，而非供应商总数。例如一个模型有两个供应商，但只有一个支持 Anthropic 协议，那么通过 Anthropic 协议请求时将无法容错。

如果需要容错保障，建议使用模型支持最广泛的协议（通常是 OpenAI 协议），或结合模型降级配置备选模型。

供应商路由

智能路由

自动容错

注意事项

相关文档