Model Catalog

模型列表

67 个模型

浏览全系列 AI 模型，涵盖文本、推理、视觉、编程、图像、视频、向量等类别

Qwen3.7 PlusNEWHOT

通义千问多模态模型

OpenAIAnthropicResponses

Qwen3.7系列高性价比Plus模型，在强大文本能力基础上全面升级视觉-语言能力，保持编码、工具使用和生产力工作流的完整智能体能力。支持多模态交互混合智能体：感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用。功能等同于快照 qwen3.7-plus-2026-05-26。

高性价比多模态智能体视觉理解

Qwen3.7 MaxNEWHOT

通义千问大语言模型

OpenAIAnthropicResponses

通义千问3.7代旗舰模型，面向智能体时代，编程、办公、长周期自主执行能力全面提升。支持思考模式切换、函数调用和联网搜索。百万级上下文。

旗舰推理编程思考模式

Qwen3 MaxNEWHOT

通义千问大语言模型

OpenAIAnthropicResponses

通义千问3代最强旗舰模型，支持思考模式切换，在复杂推理、代码生成、数学等方面表现卓越。262K上下文窗口。

旗舰推理编程思考模式

Qwen3.6 Max PreviewNEWHOT

通义千问大语言模型

qwen3.6-max-preview

OpenAIAnthropicResponses

通义千问3.6代最强预览模型，面向复杂推理、代码生成和多步骤工具任务，适合需要更强思考能力的场景。

旗舰推理预览版

Qwen3.6 PlusNEWHOT

通义千问大语言模型

OpenAIAnthropicResponses

通义千问3.6代均衡旗舰模型，支持百万级上下文、函数调用和内置工具，适合大型代码库与通用生产场景。

高性价比均衡百万上下文

Qwen3.5 PlusNEWHOT

通义千问大语言模型

OpenAIAnthropicResponses

通义千问3.5代增强版，效果、速度、成本最佳平衡。支持百万级上下文窗口，适合大规模应用场景。

高性价比均衡百万上下文

Qwen3.6 FlashNEW

通义千问大语言模型

qwen3.6-flash

OpenAIAnthropicResponses

通义千问3.6代闪电版，适合简单任务，速度快、成本低。支持百万级上下文窗口和上下文缓存。

极速低成本百万上下文

Qwen3.5 FlashNEW

通义千问大语言模型

qwen3.5-flash

OpenAIAnthropicResponses

通义千问3.5代闪电版，适合简单任务，速度快、成本低。支持百万级上下文窗口和上下文缓存。

极速低成本百万上下文

通义千问大语言模型

OpenAIAnthropicResponses

通义千问增强版，效果和速度的经典平衡点，适合大规模应用场景。

高性价比均衡通用

通义千问大语言模型

OpenAIAnthropicResponses

通义千问高速版，响应极快，成本最低，适合对延迟敏感的应用场景。

快速低成本通用

通义千问大语言模型

OpenAIAnthropicResponses

通义千问长文本模型，支持超长上下文，适合文档分析和长文本理解。上下文窗口高达1000万token。

超长上下文文档分析

通义千问大语言模型

OpenAIAnthropicResponses

通义千问极速通用模型，百万级上下文窗口，响应速度极快，成本极低，适合大规模高并发应用场景。支持函数调用和思考模式。

极速低成本百万上下文通用

Qwen3 235B-A22BNEW

通义千问大语言模型

qwen3-235b-a22b

OpenAIAnthropicResponses

Qwen3开源旗舰，2350亿参数MoE架构（激活220亿），支持思考与非思考模式动态切换。

开源MoE推理思考模式

Qwen3.6 35B-A3BNEW

通义千问大语言模型

qwen3.6-35b-a3b

OpenAIAnthropicResponses

Qwen3.6开源MoE模型，350亿总参数仅激活30亿，在智能体编程、STEM和推理任务上表现优异，Apache 2.0开源。支持思考模式切换。

开源MoE轻量编程

通义千问大语言模型

OpenAIAnthropicResponses

Qwen3开源320亿参数密集模型，在中等规模模型中表现优异。

开源推理编程

通义千问推理模型

OpenAIAnthropicResponses

通义千问推理模型，基于Qwen2.5训练，擅长数学、逻辑推理和复杂问题分析，展示完整思考链路。

推理数学逻辑思考链

通义千问多模态模型

OpenAIAnthropicResponses

通义千问视觉旗舰模型，支持图像理解、图文对话、文档OCR等多模态任务。

视觉多模态OCR图文理解

通义千问多模态模型

OpenAIAnthropicResponses

通义千问视觉增强版，平衡性能与成本的多模态模型。

视觉多模态高性价比

Qwen3 VL PlusNEW

通义千问多模态模型

qwen3-vl-plus

OpenAIAnthropicResponses

Qwen3代视觉语言模型，图像理解能力大幅提升，支持高分辨率图像输入。262K上下文窗口。

视觉多模态高分辨率

通义千问多模态模型

qwen3-vl-flash

OpenAIAnthropicResponses

Qwen3代视觉闪电版，快速图像理解，适合实时场景。

视觉极速高性价比

Qwen3.5 Omni PlusNEWHOT

通义千问多模态模型

qwen3.5-omni-plus

OpenAIAnthropicResponses

通义千问3.5代旗舰全模态模型，支持文本、图片、音频、视频任意组合输入，可输出文本与语音。3小时音频/1小时视频输入，113种输入语言，55种音色，支持联网搜索和声音复刻。

旗舰全能多模态音频输入

Qwen3.5 Omni FlashNEWHOT

通义千问多模态模型

qwen3.5-omni-flash

OpenAIAnthropicResponses

通义千问3.5代轻量全模态模型，支持文本、图片、音频、视频任意组合输入与文本+语音输出。3小时音频/1小时视频输入，113种输入语言，55种音色，支持联网搜索。高性价比之选。

高性价比全能多模态音频输入

Qwen3 Omni Flash

通义千问多模态模型

qwen3-omni-flash

OpenAIAnthropicResponses

通义千问3代全能模型，支持文本、图片、音频、视频输入与文本+语音输出。支持思考模式（思考模式下仅文本输出）。适合短视频分析与成本敏感场景。

全能多模态音频输入音频输出

Qwen3 Coder PlusNEWHOT

通义千问编程模型

qwen3-coder-plus

OpenAIAnthropicResponses

通义千问3代卓越代码模型，擅长工具调用和环境交互，代码生成、补全、Debug和重构能力出色。百万级上下文。

编程代码生成工具调用百万上下文

Qwen3 Coder FlashNEW

通义千问编程模型

qwen3-coder-flash

OpenAIAnthropicResponses

通义千问3代编程闪电版，快速代码补全和生成，适合IDE集成场景。

编程极速高性价比

Qwen Math PlusNEW

通义千问推理模型

qwen-math-plus

OpenAIAnthropicResponses

通义千问数学专用模型，擅长各类数学问题求解、证明和计算，支持LaTeX格式输出。

数学推理求解LaTeX

Qwen MT PlusNEW

通义千问专业模型

OpenAIAnthropicResponses

通义千问旗舰级翻译大模型，支持92个语种互译，翻译质量优异，适合专业翻译场景。

翻译92语种专业

通义意图识别 V3NEW

通义千问专业模型

tongyi-intent-detect-v3

OpenAIAnthropicResponses

通义千问意图理解模型，可在百毫秒级时间内快速、准确地解析用户意图，适用于客服路由、智能对话分流和指令解析等场景。

意图识别快速客服路由分类

Text Embedding V4NEWHOT

通义千问向量模型

text-embedding-v4

通义千问最新文本向量模型，支持 100+ 语种和多种编程语言，向量维度可选 2048、1536、1024、768、512、256、128、64，适用于语义检索、聚类、推荐和 RAG。

向量嵌入语义搜索RAG

Text Embedding V3NEW

通义千问向量模型

text-embedding-v3

通义千问最新文本向量模型，将文本转换为高维向量表示，适用于语义搜索、聚类、推荐等场景。

向量嵌入语义搜索

Qwen3 ASR FlashNEW

通义千问语音模型

qwen3-asr-flash

Qwen3代语音识别模型，支持11种语言自动检测及转录，支持字级时间戳、情感识别、歌唱识别和说话人分离。实时与非实时双模式。

语音识别ASR多语言实时

Qwen3 TTS Flash RealtimeNEW

通义千问语音模型

qwen3-tts-flash-realtime

Qwen3代实时语音合成模型，通过WebSocket协议进行流式语音合成，支持中文、英文等多种语言和音色，适用于语音助手、有声读物等场景。

语音合成TTS实时多语言

万相 2.6 文生图NEWHOT

通义千问图像生成

最新一代文生图旗舰模型，支持图文混排输出和图像编辑。可处理复杂指令、渲染中英文本，生成高清写实图片。支持多种分辨率和宽高比。

图像生成文生图图文混排高清写实

万相 2.6 文生视频NEWHOT

通义千问视频生成

最新一代文生视频旗舰模型，支持多镜头叙事和智能分镜。可生成2-15秒1080P高清视频，支持prompt改写。生成耗时约1-5分钟。

视频生成文生视频多镜头1080P

万相 2.6 图生视频NEWHOT

通义千问视频生成

图像驱动视频生成模型，以输入图像作为首帧生成连贯视频。支持多镜头叙事、自动配音、720P/1080P分辨率，时长2-15秒。画面连贯性和运动一致性出色。

视频生成图生视频首帧驱动多镜头

万相 2.6 图生视频 FlashNEW

通义千问视频生成

wan2.6-i2v-flash

图生视频快速版，支持有声/无声视频生成。生成速度更快，适合对延迟敏感的场景。支持720P/1080P，时长2-15秒。

视频生成图生视频快速Flash

万相 2.6 参考生视频NEW

通义千问视频生成

多模态输入视频生成模型，支持文本/图像/视频作为参考。可将人物或物体作为主角，生成单角色表演或多角色互动视频。时长2-10秒，支持智能分镜。

视频生成参考生视频角色扮演多模态

万相 2.6 参考生视频 FlashNEW

通义千问视频生成

wan2.6-r2v-flash

参考生视频快速版，支持有声/无声输出。生成速度更快，适合快速迭代场景。支持720P/1080P分辨率。

视频生成参考生视频快速Flash

PixVerse V6NEWHOT

拍我AI (PixVerse)视频生成

PixVerse最新旗舰视频生成模型，支持文生视频、图生视频，画面质量和运动一致性大幅提升。支持1-15秒时长，360p/540p/720p/1080p多种分辨率，多种宽高比。

视频生成文生视频图生视频旗舰

豆包 Seedance 2.0 旗舰版NEWHOT

火山方舟 (Volcengine)视频生成

火山引擎最新一代旗舰视频生成模型，业界顶尖水平。支持多模态参考生视频（0-9 图+0-3 视频+0-3 音频）、4K HDR 10bit 输出、有声视频自动生成、首尾帧图生视频、文生视频。时长 4-15 秒，4K/1080P/720P/480P 多分辨率，21:9/16:9/4:3/1:1/3:4/9:16 多比例。Seedance 系列最厉害的模型。

视频生成旗舰4K HDR多模态参考

豆包 Seedance 2.0 FastNEW

火山方舟 (Volcengine)视频生成

seedance-2.0-fast

Seedance 2.0 系列的快速版本，与 2.0 同代画质但生成速度更快、性价比更高。支持 720P/480P，时长 4-15 秒，适合对延迟敏感的批量场景。多模态参考生视频、有声视频全能力继承。

视频生成快速性价比有声视频

豆包 Seedance 2.0 MiniNEW

火山方舟 (Volcengine)视频生成

seedance-2.0-mini

Seedance 2.0 系列的轻量版本，体积更小、速度最快、价格最低。支持 720P/480P（不支持 1080P/4K），时长 4-15 秒。继承 2.0 系列多模态参考生视频与有声视频能力，适合大规模批量调用与成本敏感场景。

视频生成轻量最低价有声视频

豆包 Seedance 1.5 ProNEW暂不可用

火山方舟 (Volcengine)视频生成

seedance-1.5-pro

Seedance 1.5 Pro 版本，支持样片模式（draft）快速验证创意、adaptive 智能宽高比、有声视频自动生成，4-12 秒时长。性价比之选，适合创意探索和批量生成。

视频生成样片模式adaptive有声视频

豆包 Seedance 1.0 ProNEW暂不可用

火山方舟 (Volcengine)视频生成

seedance-1.0-pro

Seedance 1.0 Pro 标准版本，1080P 默认输出。支持文生视频、图生视频（首帧/首尾帧），时长 2-12 秒。画面质量稳定，适合标准生产场景与批量生成。

视频生成标准1080P首尾帧

豆包 Seedance 1.0 Pro FastNEW暂不可用

火山方舟 (Volcengine)视频生成

seedance-1.0-pro-fast

Seedance 1.0 Pro Fast 版本，1080P 默认输出，生成速度极快。支持文生视频和图生视频（首帧），时长 2-12 秒，适合快速迭代和原型验证场景。

视频生成快速1080PSeedance

HappyHorse 1.0 文生视频NEWHOT

阿里巴巴 (Alibaba)视频生成

happyhorse-1.0-t2v

阿里巴巴2026年最新AI视频生成模型，榜单排名第一。文本生成高质量视频，支持720P/1080P，3-15秒时长，多种宽高比。默认带音频直出。

视频生成文生视频高质量榜单第一

HappyHorse 1.0 图生视频NEWHOT

阿里巴巴 (Alibaba)视频生成

happyhorse-1.0-i2v

以输入图片作为首帧生成连贯视频，支持720P/1080P，3-15秒时长。画面连贯性和运动一致性出色。默认带音频直出。

视频生成图生视频首帧驱动高质量

HappyHorse 1.0 参考生视频NEW

阿里巴巴 (Alibaba)视频生成

happyhorse-1.0-r2v

支持1-9张参考图片输入，可将图中人物/物体/场景融合生成视频。支持720P/1080P，3-15秒，多种宽高比。默认带音频直出。

视频生成参考生视频多图输入高质量

HappyHorse 1.0 视频编辑NEW

阿里巴巴 (Alibaba)视频生成

happyhorse-1.0-video-edit

基于输入视频进行AI编辑，支持0-5张参考图片辅助编辑。输入视频3-60秒（超15秒截断），支持720P/1080P，可保留原始音频。

视频生成视频编辑AI编辑音频保留

DeepSeek V4 FlashNEW

DeepSeek大语言模型

deepseek-v4-flash

OpenAIAnthropic

百炼接入的 DeepSeek V4 Flash 高速模型，适合低延迟和高并发在线对话场景。

V4极速高并发性价比

DeepSeek V4 ProNEWHOT

DeepSeek推理模型

deepseek-v4-pro

OpenAIAnthropic

百炼接入的 DeepSeek V4 Pro 旗舰模型，面向复杂推理、代码生成和多步骤任务。

V4旗舰推理编程

DeepSeek V3.2NEWHOT

DeepSeek大语言模型

deepseek-v3.2

OpenAIAnthropic

深度求索最新通用大模型，MoE架构，中英双语能力突出，编程能力强大。

MoE编程中文优化

DeepSeek推理模型

OpenAIAnthropic

深度求索推理模型，在数学、编程和逻辑推理方面有卓越表现，展示完整思考过程。

推理数学编程思考链

DeepSeek大语言模型

OpenAIAnthropic

深度求索V3通用大模型，671B参数MoE架构，中英双语能力优异。

MoE中文优化编程

Claude Opus 4.7NEWHOT暂不可用

Anthropic大语言模型

claude-opus-4-7

Anthropic 当前最强通用模型，面向复杂推理、Agentic Coding 和长上下文任务。官方价格为 $5 输入 / $25 输出每百万 Token；这里按 1 USD≈¥6.8 折算。

Claude旗舰Agent视觉

Claude Sonnet 4.6NEWHOT暂不可用

Anthropic大语言模型

claude-sonnet-4-6

Anthropic 速度与智能均衡的主力模型，适合生产级对话、代码、工具调用和长上下文工作流。官方价格为 $3 输入 / $15 输出每百万 Token；这里按 1 USD≈¥6.8 折算。

Claude均衡编程视觉

Claude Haiku 4.5NEW暂不可用

Anthropic大语言模型

claude-haiku-4-5

Anthropic 高速低成本模型，具备接近前沿的智能，适合低延迟对话、分类、抽取和批量任务。官方价格为 $1 输入 / $5 输出每百万 Token；这里按 1 USD≈¥6.8 折算。

Claude极速低成本视觉

智谱AI大语言模型

OpenAIAnthropic

智谱最新大模型GLM-4.7，综合能力提升显著，中文理解力强。

中文优化推理通用

智谱AI大语言模型

OpenAIAnthropic

智谱AI GLM-5 旗舰大模型，综合能力全面提升，在推理、编程和长文本方面表现出色。

旗舰推理编程中文优化

智谱AI大语言模型

OpenAIAnthropic

智谱AI GLM-5.1 增强版旗舰模型，在 GLM-5 基础上进一步优化，复杂推理和代码生成能力更强。

旗舰推理编程增强

智谱AI大语言模型

OpenAIAnthropic

智谱AI GLM-5.2 面向长程任务（Long Horizon Task）的新一代开源旗舰模型，支持 1M 无损超长上下文。具备卓越的编程与工程能力，可自主完成任务拆解、架构设计、前后端开发、联调测试到多端部署的完整链路，适用于复杂工程、长程交互、代码生成与企业应用场景。

旗舰长上下文百万上下文编程

月之暗面大语言模型

OpenAIAnthropic

月之暗面Kimi K2.5模型，擅长长文本理解和多轮对话，中文能力出色。

长文本多轮对话中文优化

Kimi K2.6NEWHOT

月之暗面大语言模型

OpenAIAnthropic

月之暗面 Kimi K2.6 最新旗舰模型，长文本理解和创意写作能力大幅提升，支持更长上下文窗口。

旗舰长文本创意写作中文优化

月之暗面大语言模型

OpenAIAnthropic

Kimi 迄今能力最强的旗舰模型，拥有 2.8 万亿参数，基于 KDA 混合线性注意力机制（Kimi Delta Attention）和注意力残差（Attention Residuals）技术构建，原生支持视觉理解，并拥有 100 万 token 上下文窗口。全球首个开源的 3 万亿级别模型，面向长程编程、知识工作和推理等前沿智能场景而设计。

旗舰推理长程编程视觉理解

MiniMax大语言模型

OpenAIAnthropic

MiniMax M2.1模型，在创意写作和多轮对话方面表现突出。

创意写作对话通用

MiniMax M2.5NEW

MiniMax大语言模型

OpenAIAnthropic

MiniMax M2.5 增强版，推理和编程能力提升，多轮对话更加稳定。

推理编程对话

通义千问大语言模型

OpenAIAnthropicResponses

Qwen3 开源 80 亿参数轻量模型，适合边缘部署和低成本推理场景。

开源轻量高性价比