模型列表
57 个模型浏览全系列 AI 模型,涵盖文本、推理、视觉、编程、图像、视频、向量等类别
qwen3.7-plusQwen3.7系列高性价比Plus模型,在强大文本能力基础上全面升级视觉-语言能力,保持编码、工具使用和生产力工作流的完整智能体能力。支持多模态交互混合智能体:感知真实世界场景、读取屏幕并操作GUI、基于视觉参考生成代码、端到端导航移动应用。功能等同于快照 qwen3.7-plus-2026-05-26。
qwen3.7-max通义千问3.7代旗舰模型,面向智能体时代,编程、办公、长周期自主执行能力全面提升。支持思考模式切换、函数调用和联网搜索。百万级上下文。
qwen3-max通义千问3代最强旗舰模型,支持思考模式切换,在复杂推理、代码生成、数学等方面表现卓越。262K上下文窗口。
qwen3.6-max-preview通义千问3.6代最强预览模型,面向复杂推理、代码生成和多步骤工具任务,适合需要更强思考能力的场景。
qwen3.6-plus通义千问3.6代均衡旗舰模型,支持百万级上下文、函数调用和内置工具,适合大型代码库与通用生产场景。
qwen3.5-plus通义千问3.5代增强版,效果、速度、成本最佳平衡。支持百万级上下文窗口,适合大规模应用场景。
qwen3.6-flash通义千问3.6代闪电版,适合简单任务,速度快、成本低。支持百万级上下文窗口和上下文缓存。
qwen3.5-flash通义千问3.5代闪电版,适合简单任务,速度快、成本低。支持百万级上下文窗口和上下文缓存。
qwen-plus通义千问增强版,效果和速度的经典平衡点,适合大规模应用场景。
qwen-turbo通义千问高速版,响应极快,成本最低,适合对延迟敏感的应用场景。
qwen-long通义千问长文本模型,支持超长上下文,适合文档分析和长文本理解。上下文窗口高达1000万token。
qwen-flash通义千问极速通用模型,百万级上下文窗口,响应速度极快,成本极低,适合大规模高并发应用场景。支持函数调用和思考模式。
qwen3-235b-a22bQwen3开源旗舰,2350亿参数MoE架构(激活220亿),支持思考与非思考模式动态切换。
qwen3.6-35b-a3bQwen3.6开源MoE模型,350亿总参数仅激活30亿,在智能体编程、STEM和推理任务上表现优异,Apache 2.0开源。支持思考模式切换。
qwen3-32bQwen3开源320亿参数密集模型,在中等规模模型中表现优异。
qwq-plus通义千问推理模型,基于Qwen2.5训练,擅长数学、逻辑推理和复杂问题分析,展示完整思考链路。
qwen-vl-max通义千问视觉旗舰模型,支持图像理解、图文对话、文档OCR等多模态任务。
qwen-vl-plus通义千问视觉增强版,平衡性能与成本的多模态模型。
qwen3-vl-plusQwen3代视觉语言模型,图像理解能力大幅提升,支持高分辨率图像输入。262K上下文窗口。
qwen3-vl-flashQwen3代视觉闪电版,快速图像理解,适合实时场景。
qwen3-omni-flash通义千问3代全能模型,接收文本、图片、视频等多种模态输入,适合复杂多模态理解场景。
qwen3-coder-plus通义千问3代卓越代码模型,擅长工具调用和环境交互,代码生成、补全、Debug和重构能力出色。百万级上下文。
qwen3-coder-flash通义千问3代编程闪电版,快速代码补全和生成,适合IDE集成场景。
qwen-math-plus通义千问数学专用模型,擅长各类数学问题求解、证明和计算,支持LaTeX格式输出。
qwen-mt-plus通义千问旗舰级翻译大模型,支持92个语种互译,翻译质量优异,适合专业翻译场景。
tongyi-intent-detect-v3通义千问意图理解模型,可在百毫秒级时间内快速、准确地解析用户意图,适用于客服路由、智能对话分流和指令解析等场景。
text-embedding-v4通义千问最新文本向量模型,支持 100+ 语种和多种编程语言,向量维度可选 2048、1536、1024、768、512、256、128、64,适用于语义检索、聚类、推荐和 RAG。
text-embedding-v3通义千问最新文本向量模型,将文本转换为高维向量表示,适用于语义搜索、聚类、推荐等场景。
qwen3-asr-flashQwen3代语音识别模型,支持11种语言自动检测及转录,支持字级时间戳、情感识别、歌唱识别和说话人分离。实时与非实时双模式。
qwen3-tts-flash-realtimeQwen3代实时语音合成模型,通过WebSocket协议进行流式语音合成,支持中文、英文等多种语言和音色,适用于语音助手、有声读物等场景。
wan2.6-t2i最新一代文生图旗舰模型,支持图文混排输出和图像编辑。可处理复杂指令、渲染中英文本,生成高清写实图片。支持多种分辨率和宽高比。
wan2.6-t2v最新一代文生视频旗舰模型,支持多镜头叙事和智能分镜。可生成2-15秒1080P高清视频,支持prompt改写。生成耗时约1-5分钟。
wan2.6-i2v图像驱动视频生成模型,以输入图像作为首帧生成连贯视频。支持多镜头叙事、自动配音、720P/1080P分辨率,时长2-15秒。画面连贯性和运动一致性出色。
wan2.6-i2v-flash图生视频快速版,支持有声/无声视频生成。生成速度更快,适合对延迟敏感的场景。支持720P/1080P,时长2-15秒。
wan2.6-r2v多模态输入视频生成模型,支持文本/图像/视频作为参考。可将人物或物体作为主角,生成单角色表演或多角色互动视频。时长2-10秒,支持智能分镜。
wan2.6-r2v-flash参考生视频快速版,支持有声/无声输出。生成速度更快,适合快速迭代场景。支持720P/1080P分辨率。
pixverse-v6PixVerse最新旗舰视频生成模型,支持文生视频、图生视频,画面质量和运动一致性大幅提升。支持1-15秒时长,360p/540p/720p/1080p多种分辨率,多种宽高比。
happyhorse-1.0-t2v阿里巴巴2026年最新AI视频生成模型,榜单排名第一。文本生成高质量视频,支持720P/1080P,3-15秒时长,多种宽高比。默认带音频直出。
happyhorse-1.0-i2v以输入图片作为首帧生成连贯视频,支持720P/1080P,3-15秒时长。画面连贯性和运动一致性出色。默认带音频直出。
happyhorse-1.0-r2v支持1-9张参考图片输入,可将图中人物/物体/场景融合生成视频。支持720P/1080P,3-15秒,多种宽高比。默认带音频直出。
happyhorse-1.0-video-edit基于输入视频进行AI编辑,支持0-5张参考图片辅助编辑。输入视频3-60秒(超15秒截断),支持720P/1080P,可保留原始音频。
deepseek-v4-flash百炼接入的 DeepSeek V4 Flash 高速模型,适合低延迟和高并发在线对话场景。
deepseek-v4-pro百炼接入的 DeepSeek V4 Pro 旗舰模型,面向复杂推理、代码生成和多步骤任务。
deepseek-v3.2深度求索最新通用大模型,MoE架构,中英双语能力突出,编程能力强大。
deepseek-r1深度求索推理模型,在数学、编程和逻辑推理方面有卓越表现,展示完整思考过程。
deepseek-v3深度求索V3通用大模型,671B参数MoE架构,中英双语能力优异。
claude-opus-4-7Anthropic 当前最强通用模型,面向复杂推理、Agentic Coding 和长上下文任务。官方价格为 $5 输入 / $25 输出每百万 Token;这里按 1 USD≈¥6.8 折算。
claude-sonnet-4-6Anthropic 速度与智能均衡的主力模型,适合生产级对话、代码、工具调用和长上下文工作流。官方价格为 $3 输入 / $15 输出每百万 Token;这里按 1 USD≈¥6.8 折算。
claude-haiku-4-5Anthropic 高速低成本模型,具备接近前沿的智能,适合低延迟对话、分类、抽取和批量任务。官方价格为 $1 输入 / $5 输出每百万 Token;这里按 1 USD≈¥6.8 折算。
glm-4.7智谱最新大模型GLM-4.7,综合能力提升显著,中文理解力强。
glm-5智谱AI GLM-5 旗舰大模型,综合能力全面提升,在推理、编程和长文本方面表现出色。
glm-5.1智谱AI GLM-5.1 增强版旗舰模型,在 GLM-5 基础上进一步优化,复杂推理和代码生成能力更强。
kimi-k2.5月之暗面Kimi K2.5模型,擅长长文本理解和多轮对话,中文能力出色。
kimi-k2.6月之暗面 Kimi K2.6 最新旗舰模型,长文本理解和创意写作能力大幅提升,支持更长上下文窗口。
MiniMax-M2.1MiniMax M2.1模型,在创意写作和多轮对话方面表现突出。
MiniMax-M2.5MiniMax M2.5 增强版,推理和编程能力提升,多轮对话更加稳定。
qwen3-8bQwen3 开源 80 亿参数轻量模型,适合边缘部署和低成本推理场景。