功能
供应商路由
同一模型的多供应商智能路由与自动容错
nexusflow 为同一模型配置了多个供应商端点。系统会根据各端点的实时表现智能选择最优端点,并在供应商不可用时自动切换,整个过程对调用方完全透明。
智能路由
当你发起 API 请求时,系统会根据模型 ID 和请求协议筛选出所有匹配的供应商端点,并综合端点的稳定性、延迟等因素选择最优端点。当某个端点出现异常时,系统会自动降低其优先级;恢复后自动回到正常位置,无需人工干预。
健康检测
定时检测上游端点状态,连续失败自动标记为 degraded / down。
加权选择
综合端点优先级和权重进行负载均衡,健康端点优先使用。
透明恢复
故障端点恢复后自动回到正常优先级,无需人工干预。
自动容错
当选中的端点返回服务端错误(5xx)或限流(429)时,系统会自动重试下一个可用端点,直到请求成功或所有端点都已尝试。400 类客户端错误不会触发重试。
注意事项
流式请求
如果端点在开始返回数据之前就失败了,系统可以无感地切换到下一个端点。但一旦数据已经开始发送给客户端,就无法再切换端点,错误会直接透传给客户端。
建议在客户端实现流式请求的错误处理逻辑,以应对流中断的情况。
建议在客户端实现流式请求的错误处理逻辑,以应对流中断的情况。
协议不一致
容错能力取决于该模型在当前请求协议下有多少个可用端点,而非供应商总数。例如一个模型有两个供应商,但只有一个支持 Anthropic 协议,那么通过 Anthropic 协议请求时将无法容错。
如果需要容错保障,建议使用模型支持最广泛的协议(通常是 OpenAI 协议),或结合模型降级配置备选模型。
如果需要容错保障,建议使用模型支持最广泛的协议(通常是 OpenAI 协议),或结合模型降级配置备选模型。