AI 模型列表

按上线时间与能力方向整理,帮助你找到适合当前任务的 AI 模型。

Claude Opus 4.8

#1

anthropic

Opus 4.8 是对 Opus 4.7 的重点升级,适用于编码、代理任务和企业工作流程。性能优越,特别是在复杂多步骤编码和专业任务中表现出色,包括文档起草、数据分析和演示。建议用于长远编码和代理任务。

上下文 1000K¥48.71 / 100万 tokens¥243.57 / 100万 tokens开始对话 →

Step 3.7 Flash

#2

stepfun

StepFun的旗舰多模态推理模型,采用198B参数/11B激活稀疏MoE架构,原生支持图像和视频理解。

上下文 256K¥1.95 / 100万 tokens¥11.20 / 100万 tokens开始对话 →

Qwen 3.7 Max

#3

alibaba

Qwen3.7是面向代理时代的下一代旗舰模型,擅长编程、办公和生产力任务,以及长远自主执行。

上下文 991K¥12.18 / 100万 tokens¥36.54 / 100万 tokens开始对话 →

Grok Build 0.1

#4

xai

xAI的快速编码模型,专为代理编码训练。

上下文 256K¥9.74 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

Gemini 3.5 Flash

#5

google

谷歌最新模型,专为编码能力和并行代理执行循环优化。默认中等思维努力,响应更快、更省成本。

上下文 1000K¥14.61 / 100万 tokens¥87.69 / 100万 tokens开始对话 →

Gemini 3.1 Flash Lite

#6

google

Gemini 3.1 Flash Lite在整体质量上优于2.5版本,接近2.5在关键能力方面的表现,是高容量应用的主力模型,改进了音频输入、翻译、数据提取等多项功能。

上下文 1000K¥2.44 / 100万 tokens¥14.61 / 100万 tokens开始对话 →

Recraft V4.1 Utility Pro

#7

recraft

V4.1基于相同的视觉美学和审美,增强了自然的逼真度,渐变更梦幻。可以实现以前无法实现的插画风格。阅读短提示更容易,作品更引人注目。适合追求简洁美学的场景,采用平面光、正面构图和简洁控制。

上下文 —N/AN/A开始对话 →

Recraft V4.1 Pro

#8

recraft

V4.1基于相同的视觉美学和审美,增强了自然的逼真度,渐变更梦幻。可以实现以前无法实现的插画风格。阅读短提示更容易,作品更引人注目。V4.1 Pro生成更高分辨率的图像,适合需要更多空间的创意。

上下文 —N/AN/A开始对话 →

Recraft V4.1

#9

recraft

V4.1基于相同的视觉美学和审美,增强了自然的逼真度,渐变更梦幻。可以实现以前无法实现的插画风格。阅读短提示更容易,作品更引人注目。

上下文 —N/AN/A开始对话 →

Recraft V4.1 Utility

#10

recraft

V4.1基于相同的视觉美学和审美,增强了自然的逼真度,渐变更梦幻。可以实现以前无法实现的插画风格。阅读短提示更容易,作品更引人注目。适合追求简洁美学的场景,采用平面光、正面构图和简洁控制。

上下文 —N/AN/A开始对话 →

Grok 4.3

#11

xai

Grok 4.3是一个与Grok 4.20规模相当、架构改进、知识截止到2025年12月的新模型。

上下文 1000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

GPT 5.5

#12

openai

GPT‑5.5能更快理解任务,自动完成写作、调试、研究、分析等多项工作,能自主规划和处理复杂任务。

上下文 1000K¥48.71 / 100万 tokens¥292.29 / 100万 tokens开始对话 →

GPT 5.5 Pro

#13

openai

暂无简介

上下文 1000K¥292.29 / 100万 tokens¥1753.71 / 100万 tokens开始对话 →

DeepSeek V4 Flash

#14

deepseek

DeepSeek-V4系列在架构和优化方面进行了关键升级,包括混合注意力架构、流形约束超连接和Muon优化器,以提升长文本处理效率、残差连接和训练稳定性。

上下文 1000K¥1.36 / 100万 tokens¥2.73 / 100万 tokens开始对话 →

DeepSeek V4 Pro

#15

deepseek

DeepSeek-V4系列在架构和优化上进行了多项升级,包括结合CSA和HCA的混合注意力架构、增强残差连接的ManifoldConstrained超连接,以及提高收敛速度和稳定性的Muon优化器。

上下文 1000K¥4.24 / 100万 tokens¥8.48 / 100万 tokens开始对话 →

MiMo V2.5 Pro

#16

xiaomi

MiMo V2.5 Pro 在智能能力、复杂软件工程和长距离任务方面比前代产品更优,是一款具有1.02万亿参数的混合专家模型。

上下文 1050K¥4.24 / 100万 tokens¥8.48 / 100万 tokens开始对话 →

MiMo M2.5

#17

xiaomi

一款支持文本、图像、视频和音频理解的本地全模态模型,具有强大的智能代理功能。

上下文 1050K¥1.36 / 100万 tokens¥2.73 / 100万 tokens开始对话 →

Qwen 3.6 27B

#18

alibaba

Qwen3.6 35B-A3B 原生视觉语言模型采用混合架构,具有更高的推理效率,显著提升了编码、数学推理、空间智能以及目标检测能力。

上下文 256K¥5.85 / 100万 tokens¥35.07 / 100万 tokens开始对话 →

GPT Image 2

#19

openai

GPT Image 2是OpenAI的先进图像生成模型,支持快速高质量图像生成与编辑。

上下文 —¥48.71 / 100万 tokens¥292.29 / 100万 tokens开始对话 →

Kimi K2.6

#20

moonshotai

Kimi K2.6在长远编码任务中表现出色,能生成专业级的设计。

上下文 262K¥9.26 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

Qwen 3.6 Max Preview

#21

alibaba

相比之前的Qwen3-Max和Qwen3.6-Plus,此模型具有增强的编码能力、更高效的执行和显著提升的前端开发技能,且知识保持能力也得到改善。

上下文 240K¥12.67 / 100万 tokens¥75.99 / 100万 tokens开始对话 →

Claude Opus 4.7

#22

anthropic

Opus 4.7在复杂多步骤任务和代理执行方面表现更强,提升了知识工作中的表现,如起草文件、制作演示和数据分析。

上下文 1000K¥48.71 / 100万 tokens¥243.57 / 100万 tokens开始对话 →

Seedance 2.0

#23

bytedance

Seedance 2.0采用统一的多模态音视频联合生成架构,支持文本、图像、音频和视频四种输入方式,在生成质量、物理准确性、视觉真实感和可控性方面有大幅提升,适用于高质量创作场景。

上下文 —N/AN/A开始对话 →

Seedance 2.0 Fast

#24

bytedance

Seedance 2.0 Fast是一款继承Seedance 2.0核心功能和优势、速度更快的新一代多模态视频生成模型。

上下文 —N/AN/A开始对话 →

GLM 5.1

#25

zai

GLM-5.1在编程能力上实现了重大飞跃,特别擅长处理长时间任务,能够连续独立工作超过8小时,自动规划、执行和改进,输出完整的工程级结果。

上下文 203K¥13.64 / 100万 tokens¥42.87 / 100万 tokens开始对话 →

Qwen 3.6 Plus

#26

alibaba

Qwen3.6本地视觉语言Plus系列模型性能优异,在代码、多模态识别和目标定位等方面有显著提升,优于3.5系列。

上下文 1000K¥4.87 / 100万 tokens¥29.23 / 100万 tokens开始对话 →

Gemma 4 26B A4B IT

#27

google

Gemma 是由谷歌 DeepMind 开发的一系列开源多模态模型,支持多语言输入,具有大容量上下文窗口,并包括预训练和指令调优版本。

上下文 262K¥1.46 / 100万 tokens¥5.85 / 100万 tokens开始对话 →

Gemma 4 31B IT

#28

google

Gemma 4 31B 是为应对最苛刻的企业任务和复杂推理设计的,拥有256K令牌的上下文窗口,能够轻松处理整个代码库和大量图像。

上下文 262K¥1.36 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

GLM 5V Turbo

#29

zai

Z.AI 的首款多模态编码基础模型,适用于视觉编码任务。能处理图像、视频和文本等多模态输入,擅长长远规划、复杂编码和动作执行。针对agent工作流程优化,可与Claude Code和OpenClaw等代理无缝协作完成理解环境、规划动作和执行任务的循环。

上下文 200K¥11.69 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

Trinity Large Thinking

#30

arcee-ai

Arcee AI Trinity-Large家族的推理优化变体,拥有398B参数的稀疏Mixture-of-Experts模型,每个标记约13B有效参数。基于Trinity-Large-Base,经过链式思考和agent式RL训练,性能领先同时保持强大通用能力。

上下文 262K¥2.44 / 100万 tokens¥8.77 / 100万 tokens开始对话 →

Kat Coder Pro V2

#31

kwaipilot

为复杂企业项目和SaaS整合而设计的高性能版本。

上下文 256K¥2.92 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

MiniMax M2.7

#32

minimax

M2.7在软件工程中表现出色,支持端到端项目交付、日志分析、漏洞排查、代码安全和机器学习等任务。

上下文 205K¥2.92 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

MiniMax M2.7 High Speed

#33

minimax

M2.7高速版:速度更快,输出约100个每秒,更高灵活性,性能相同。

上下文 205K¥5.85 / 100万 tokens¥23.38 / 100万 tokens开始对话 →

NVIDIA Nemotron 3 Super 120B A12B

#34

nvidia

NVIDIA Nemotron 3 Super是120B参数的开源混合MoE模型,激活12B参数以提高效率和准确性。提供高达7倍吞吐量,支持长时序记忆,便于多步骤长任务。开源,便于定制和部署。

上下文 256K¥1.46 / 100万 tokens¥6.33 / 100万 tokens开始对话 →

MiMo V2 Pro

#35

xiaomi

小米 MiMo-V2-Pro,适用于苛刻的实际agent工作流程,拥有超1T参数(其中42B活跃参数),采用混合注意力架构,支持最长达1M标记的超长上下文。

上下文 1000K¥9.74 / 100万 tokens¥29.23 / 100万 tokens开始对话 →

GPT 5.4 Mini

#36

openai

GPT-5.4 Mini,结合GPT-5.4的优势,更快更高效,适合大量工作负载。

上下文 400K¥7.31 / 100万 tokens¥43.84 / 100万 tokens开始对话 →

GPT 5.4 Nano

#37

openai

GPT-5.4 Nano,设计用于速度和成本优先任务,如分类、数据提取、排序和子代理。

上下文 400K¥1.95 / 100万 tokens¥12.18 / 100万 tokens开始对话 →

GLM 5 Turbo

#38

zai

GLM 5 Turbo,为OpenClaw场景深度优化的基础模型。从训练开始,增强工具调用、命令执行、定时和持久任务、长链执行等核心能力。

上下文 203K¥11.69 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

Grok 4.20 Multi Agent Beta

#39

xai

多个代理并行协作,进行深度研究任务。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Grok 4.20 Beta Reasoning

#40

xai

Grok 4.20 Beta,行业领先速度和代理工具调用能力,最低幻觉率,严格遵循提示,保持高精度和真实。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Grok 4.20 Beta Non-Reasoning

#41

xai

Grok 4.20 Beta,行业领先速度和代理工具调用能力,最低幻觉率,严格提示遵循,保持高精度和真实。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Grok 4.20 Reasoning

#43

xai

Grok 4.20 Beta,行业领先速度和代理工具调用能力,最低幻觉率,严格遵循提示,保持高精度和真实。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Grok 4.20 Multi-Agent

#44

xai

多个代理并行协作,进行深度研究任务。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Grok 4.20 Non-Reasoning

#45

xai

Grok 4.20 Beta,行业领先速度和代理工具调用能力,最低幻觉率,严格提示遵循,保持高精度和真实。

上下文 2000K¥12.18 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

GPT 5.4

#46

openai

GPT-5.4,是OpenAI最强的通用模型,属于GPT-5旗舰系列,兼具智能和agent任务能力。

上下文 1050K¥24.36 / 100万 tokens¥146.14 / 100万 tokens开始对话 →

GPT 5.4 Pro

#47

openai

GPT-5.4 Pro 使用更多计算能力,以进行更深入的思考,并持续提供更优质的答案。旨在解决复杂问题。

上下文 1050K¥292.29 / 100万 tokens¥1753.71 / 100万 tokens开始对话 →

Gemini 3.1 Flash Lite Preview

#48

google

Gemini 3.1 Flash Lite 预览在整体质量上优于2.5 Flash Lite,在关键能力方面接近2.5 Flash的表现。适用于高容量场景,在音频输入/ASR、RAG片段排序、翻译、数据提取和代码完成方面均有改进。

上下文 1000K¥2.44 / 100万 tokens¥14.61 / 100万 tokens开始对话 →

GPT-5.3 Chat

#49

openai

驱动ChatGPT的模型是gpt-5.3-chat-latest,为OpenAI最佳的通用模型,属于GPT-5系列。

上下文 128K¥17.05 / 100万 tokens¥136.40 / 100万 tokens开始对话 →

Gemini 3.1 Flash Image Preview (Nano Banana 2)

#50

google

Gemini 3.1 Flash Image 针对图像理解与生成,提供价格与性能的平衡。

上下文 131K¥4.87 / 100万 tokens¥29.23 / 100万 tokens开始对话 →

Qwen 3.5 Flash

#51

alibaba

Qwen3.5 视觉-语言Flash模型基于混合架构,结合线性注意机制与稀疏专家混合模型,提高推理效率。性能在纯文本与多模任务中均有突破,响应快速,平衡推理速度与整体性能。

上下文 1000K¥0.9743 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

GPT 5.3 Codex

#52

openai

GPT-5.3-Codex 在GPT-5.2-Codex的编码性能及推理和专业知识能力上均有提升,速度快25%。适合长时间任务,包括研究、工具使用与复杂执行。

上下文 400K¥17.05 / 100万 tokens¥136.40 / 100万 tokens开始对话 →

Mercury 2

#53

inception

基于扩散的推理大模型,通过并行优化生成文本(非逐词),实时延迟约1千 tokens/sec,支持128K上下文与内建工具/JSON。

上下文 128K¥2.44 / 100万 tokens¥7.31 / 100万 tokens开始对话 →

Gemini 3.1 Pro Preview

#54

google

该模型优于Gemini 2.5 Pro,面向复杂推理与智能任务,适用于编码、多步骤函数调用、规划、深度知识与指令执行等场景。

上下文 1000K¥19.49 / 100万 tokens¥116.91 / 100万 tokens开始对话 →

Claude Sonnet 4.6

#55

anthropic

Claude Sonnet 4.6 是性能最强的Sonnet类模型,在编码、智能体与专业任务中表现卓越。擅长迭代开发、复杂代码、项目管理、文档制作与网页质量检测与自动化。

上下文 1000K¥29.23 / 100万 tokens¥146.14 / 100万 tokens开始对话 →

Recraft V4 Pro

#56

recraft

该模型渲染逼真,肌肤效果与自然纹理真实自然,避免合成伪像,色彩搭配丰富,光影效果鲜明,生成原创新颖人物与造型,风格现代独特。

上下文 —N/AN/A开始对话 →

Recraft V4

#57

recraft

与Pro版本类似,强调逼真肌理和自然纹理,避免合成伪像,色彩丰富多样,光影独特,生成创新人物与形象。

上下文 —N/AN/A开始对话 →

Qwen 3.5 Plus

#58

alibaba

Qwen3.5 Plus 采用混合架构,结合线性注意机制与稀疏专家模型,推理效率高。多任务表现与领先模型相当,纯文本与多模能力大幅提升。

上下文 1000K¥3.90 / 100万 tokens¥23.38 / 100万 tokens开始对话 →

MiniMax M2.5

#59

minimax

MiniMax-M2.5 为最先进的语言模型,支持各种复杂系统的完整开发,包括Web、安卓、iOS、Windows与Mac平台的全栈项目,涵盖API、逻辑与数据库。

上下文 205K¥2.92 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

GLM 5

#60

zai

Zai的旗舰基础模型,面向Agentic工程,支持复杂系统工程与长距离Agent任务。在编码与Agent能力方面达到SOTA,与Claude Opus 4.5相当。

上下文 203K¥9.74 / 100万 tokens¥31.18 / 100万 tokens开始对话 →

MiniMax M2.5 High Speed

#61

minimax

M2.5高速版:性能相同,速度更快(约100 token/sec)。

上下文 205K¥5.85 / 100万 tokens¥23.38 / 100万 tokens开始对话 →

Claude Opus 4.6

#62

anthropic

Opus 4.6 是最佳编码与专业模型,支持机器人完成真实世界任务。能解决难题、查找复杂错误,并深度理解代码库,提供接近生产的文档、报告与表格。

上下文 1000K¥48.71 / 100万 tokens¥243.57 / 100万 tokens开始对话 →

Kling v3.0 Image-to-Video

#63

klingai

Kling 3.0支持多模态输入输出,包括文本、图片、音频和视频,整合视频理解、生成与编辑,能跟随复杂叙事、精准控制镜头,增强提示遵循。

上下文 —N/AN/A开始对话 →

Kling v3.0 Text-to-Video

#64

klingai

Kling 3.0支持多模态输入输出,包括文本、图片、音频与视频,整合视频理解、生成与编辑,能跟随复杂叙事、精准控制镜头,增强提示遵循。

上下文 —N/AN/A开始对话 →

Seedream 5.0 Lite

#65

bytedance

字节跳动最新图像生成模型,支持联网检索,增强信息实时性和相关性,提升推理理解能力,适用于企业视觉创作。

上下文 —N/AN/A开始对话 →

Grok Imagine Image

#66

xai

使用xAI的imagine API,从文本提示生成高质量图像。

上下文 —N/AN/A开始对话 →

Grok Imagine

#67

xai

最先进的视频生成模型,支持高质量、低成本、低延迟。能从图像、文本或复杂序列生成视频。

上下文 —N/AN/A开始对话 →

Kimi K2.5

#68

moonshotai

Kimi的多模态模型,支持视觉和文本输入,适用于推理和对话任务。

上下文 262K¥5.85 / 100万 tokens¥29.23 / 100万 tokens开始对话 →

GLM 4.7

#69

zai

Z.ai的旗舰模型,增强编程能力,支持多步推理和稳定执行。

上下文 131K¥21.92 / 100万 tokens¥26.79 / 100万 tokens开始对话 →

Kling v2.6 Image-to-Video

#70

klingai

Kling 2.6引入“Native Audio”功能,生成完整视频,包括自然声和环境音,体验“所见即所听”。

上下文 —N/AN/A开始对话 →

Kling v2.6 Text-to-Video

#71

klingai

Kling 2.6引入“Native Audio”功能,支持完整视频生成,包括自然声和环境音,体验沉浸式感受。

上下文 —N/AN/A开始对话 →

Kling v2.6 Motion Control

#72

klingai

Kling 2.6“Native Audio”功能,支持完整视频生成,增强视觉听觉一致性。

上下文 —N/AN/A开始对话 →

GPT 5.2 Codex

#73

openai

GPT-5.2-Codex针对代理编码优化,提升长距离任务表现,增强大规模代码变更能力,优化Windows环境表现和安全性。

上下文 400K¥17.05 / 100万 tokens¥136.40 / 100万 tokens开始对话 →

Gemini 3 Flash

#74

google

谷歌速度优化模型,结合前沿智能、强大搜索和基础。

上下文 1000K¥4.87 / 100万 tokens¥29.23 / 100万 tokens开始对话 →

MiMo V2 Flash

#75

xiaomi

小米Mimo-V2-Flash,极致推理效率的MoE模型,融合创新注意力架构,全球顶尖开源模型之一。

上下文 262K¥0.9743 / 100万 tokens¥2.92 / 100万 tokens开始对话 →

GPT Image 1.5

#76

openai

OpenAI最新图像生成模型,更好遵循指令,忠实提示。

上下文 —¥48.71 / 100万 tokens¥311.77 / 100万 tokens开始对话 →

Wan v2.6 Text-to-Video

#77

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

Wan v2.6 Reference-to-Video Flash

#78

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

Wan v2.6 Image-to-Video Flash

#79

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

Seedance v1.5 Pro

#80

bytedance

字节跳动专业视频模型,V2A本地生成,实现同步音视频输出,提升专业视频效率。

上下文 —N/AN/A开始对话 →

Wan v2.6 Image-to-Video

#81

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

Wan v2.6 Reference-to-Video

#82

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

GPT 5.2

#83

openai

OpenAI最佳通用模型,GPT-5旗舰系列,智能表现出色。

上下文 400K¥17.05 / 100万 tokens¥136.40 / 100万 tokens开始对话 →

GPT 5.2 Chat

#84

openai

支撑ChatGPT的gpt-5.2-chat-latest,是GPT-5系列的优质通用模型。

上下文 128K¥17.05 / 100万 tokens¥136.40 / 100万 tokens开始对话 →

GPT 5.2

#85

openai

GPU-5.2专业版,更智能、更精准。

上下文 400K¥204.60 / 100万 tokens¥1636.80 / 100万 tokens开始对话 →

Devstral 2

#86

mistral

企业级文本模型,善于探索代码、编辑文件、驱动软件工程代理。

上下文 256K¥3.90 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

Mistral Large 3

#87

mistral

Mistral Large 3 2512 是 Mistral 目前最强模型,采用稀疏专家组合架构,具有 41B 活跃参数(总计 675B)。

上下文 256K¥4.87 / 100万 tokens¥14.61 / 100万 tokens开始对话 →

DeepSeek V3.2

#88

deepseek

DeepSeek-V3.2:V3.2-Exp 的官方继任者。

上下文 128K¥2.73 / 100万 tokens¥4.09 / 100万 tokens开始对话 →

DeepSeek V3.2 Thinking

#89

deepseek

DeepSeek‑V3.2 结合高计算效率和卓越推理能力,适用于长上下文推理和智能任务。采用稀疏注意力、可扩展强化学习框架和大规模任务合成管线,能高效处理复杂多步骤流程。

上下文 128K¥6.04 / 100万 tokens¥18.02 / 100万 tokens开始对话 →

Ministral 14B

#90

mistral

Ministral 3 14B 是 Ministral 3 系列中最大的模型,性能与更大型号的 Mistral Small 3.2 24B 相当,适合本地部署,兼容多种硬件。

上下文 256K¥1.95 / 100万 tokens¥1.95 / 100万 tokens开始对话 →

Trinity Mini

#91

arcee-ai

Trinity Mini 是一款 26B 参数(3B 活跃)稀疏专家混合模型,设计用于长上下文推理、函数调用和多步骤智能任务。

上下文 131K¥0.4384 / 100万 tokens¥1.46 / 100万 tokens开始对话 →

Seedream 4.5

#92

bytedance

Seedream 4.5 是字节跳动开发的最新图像生成模型,比 Seedream 4.0 在编辑连贯性、主体细节、光影、色调方面有大幅提升。增强了肖像润色和细小文字渲染能力,图像合成、多样性、推理和美观性也有所改善。

上下文 —N/AN/A开始对话 →

GPT 5.1 Codex Max

#93

openai

GPT‑5.1-Codex-Max 专为智能编码设计。

上下文 400K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

Gemini 3 Pro Preview

#94

google

此模型优于 Gemini 2.5 Pro,适用于复杂推理或智能工作流,支持编码、多步函数调用、规划、深度知识任务和指令执行。

上下文 1000K¥19.49 / 100万 tokens¥116.91 / 100万 tokens开始对话 →

GPT-5.1 Instant

#96

openai

GPT‑5.1 Instant(或 GPT‑5.1 聊天)是更温和、更会话化的 GPT‑5‑chat 版本,改进了指令执行和推理能力,能根据情况调整思考时间。

上下文 128K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

GPT 5.1 Thinking

#97

openai

GPT‑5.1 的升级版,更精准地调节思考时间,对复杂问题多花时间,简单任务响应更快。

上下文 400K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

GPT 5.1 Codex Mini

#98

openai

GPT‑5.1 Codex mini 更小、更快、更廉价的 GPT‑5.1 Codex 版本。

上下文 400K¥2.44 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

GPT-5.1-Codex

#99

openai

GPT‑5.1‑Codex 针对 Codex 类环境的智能编码任务优化的 GPT‑5.1 版本。

上下文 400K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

Kimi K2 Thinking

#100

moonshotai

Kimi K2 Thinking 是 Moonshot AI 开发的先进开源思考模型,能连续调用工具 200-300 次,多个步骤推理能力强,在复杂任务中表现优异,已在多个基准测试中取得突破。

上下文 262K¥5.85 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Kimi K2 Thinking Turbo

#101

moonshotai

kimi-k2-thinking 的高速版本,适合需要深度推理和极快响应的场景。

上下文 262K¥11.20 / 100万 tokens¥77.94 / 100万 tokens开始对话 →

Seedance v1.0 Pro Fast

#102

bytedance

Seedance 1.0 Pro Fast 在质量、速度和成本之间取得平衡,性能卓越,适合创作者使用。

上下文 —N/AN/A开始对话 →

MiniMax M2.1

#103

minimax

MiniMax 2.1 是最新模型,专为编码、工具使用、指令遵循和长远规划优化,具备高鲁棒性。

上下文 205K¥2.92 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

MiniMax M2

#104

minimax

MiniMax-M2 量身打造的高效智能模型,紧凑、快速、经济(总参数 2300 亿,活跃参数 10 亿),适合编码和智能任务,同时保持强大的通用智能。

上下文 205K¥2.92 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

MiniMax M2.1 Lightning

#105

minimax

MiniMax-M2.1-lightning 是 MiniMax-M2.1 的更快版本,性能相同但吞吐量显著提高(输出速度 ~100 TPS,MiniMax-M2 输出速度 ~60 TPS)。

上下文 205K¥2.92 / 100万 tokens¥23.38 / 100万 tokens开始对话 →

KAT-Coder-Pro V1

#106

kwaipilot

KAT-Coder-Pro V1 是 KwaiKAT 系列中最先进的代理编码模型,专为编码任务设计,在软件工程场景表现出色,解决率达 73.4%。经过多阶段训练优化,具备工具使用、多轮交互、指令执行、泛化能力和全面能力。

上下文 256K¥0.2923 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

Claude Haiku 4.5

#107

anthropic

Claude Haiku 4.5 在编码、计算机使用和代理任务上表现接近 Sonnet 4,但成本更低、速度更快。适合大规模子代理部署、免费产品和预算敏感的应用。

上下文 200K¥9.74 / 100万 tokens¥48.71 / 100万 tokens开始对话 →

Interfaze Beta

#108

interfaze

Interfaze 基于新架构,将专业的 DNN/CNN 模型与 LLMs 融合,适用于 OCR、爬取、分类、STT 等需要确定性和高一致性的开发任务。

上下文 1000K¥14.61 / 100万 tokens¥34.10 / 100万 tokens开始对话 →

GPT Image 1 Mini

#109

openai

GPT Image 1 的经济实惠版本,具备多模态能力,接受文本和图像输入,生成图像输出。

上下文 —¥19.49 / 100万 tokens¥77.94 / 100万 tokens开始对话 →

GLM 4.6

#110

zai

GLM-4.6 是 GLM 系列的最新版本,全面提升编码、长文本处理、推理、搜索、写作和代理应用等多个领域的能力。

上下文 200K¥5.85 / 100万 tokens¥21.43 / 100万 tokens开始对话 →

GLM-4.6V

#111

zai

GLM-4.6V 系列是 Z.ai 的多模态大模型,训练中上下文窗口增至 128k,视觉理解性能达同参数模型的最佳水平(SoTA)。

上下文 128K¥2.92 / 100万 tokens¥8.77 / 100万 tokens开始对话 →

Claude Sonnet 4.5

#112

anthropic

Claude Sonnet 4.5 是 Sonnet 系列的最新模型,性能和功能均优于 Sonnet 4。

上下文 1000K¥29.23 / 100万 tokens¥146.14 / 100万 tokens开始对话 →

Qwen3 VL 235B A22B Thinking

#113

alibaba

Qwen3 VL 模型显著增强多模态推理能力,特别优化 STEM 和数学推理,视觉感知、识别和 OCR 皆有大幅提升。

上下文 131K¥3.90 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

Qwen3 VL 235B A22B Instruct

#114

alibaba

Qwen3 VL 模型在视觉编码和空间感知方面全面升级,支持超长视频理解,OCR 功能大幅增强。

上下文 131K¥3.90 / 100万 tokens¥15.59 / 100万 tokens开始对话 →

Wan v2.5 Text-to-Video Preview

#115

alibaba

暂无简介

上下文 —N/AN/A开始对话 →

Qwen3 Max

#116

alibaba

Qwen3 Max 在代理编程和工具调用方面优于预览版,达到 SOTA 性能,更适应复杂场景。

上下文 262K¥11.69 / 100万 tokens¥58.46 / 100万 tokens开始对话 →

Qwen3 Max Preview

#117

alibaba

Qwen3 Max 预览版在能力上优于 2.5 系列,提升中英文本理解、复杂指令、多语能力及工具调用,减少谎言。

上下文 262K¥11.69 / 100万 tokens¥58.46 / 100万 tokens开始对话 →

Kling v2.5 Turbo Text-to-Video

#118

klingai

Kling 2.5 Turbo 大幅提升视频生成速度、质量、稳定性和创造控制,专业级 AI 视频更快更连贯,更易从文本提示指挥。

上下文 —N/AN/A开始对话 →

Kling v2.5 Turbo Image-to-Video

#119

klingai

Kling 2.5 Turbo 重点优化速度、视频质量、稳定性和创造控制,适合专业 AI 视频制作。

上下文 —N/AN/A开始对话 →

DeepSeek V3.1 Terminus

#120

deepseek

DeepSeek V3.1 Terminus 在基准测试中的输出更稳定可靠,改进了语言一致性和代理升级。

上下文 131K¥2.63 / 100万 tokens¥9.74 / 100万 tokens开始对话 →

GPT-5-Codex

#121

openai

GPT-5-Codex 是针对代理编码任务优化的 GPT-5 版本,适用于 Codex 等环境。

上下文 400K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

Qwen3 Next 80B A3B Thinking

#122

alibaba

新一代 Qwen3 开源思维模型,提升了指令执行和总结响应的能力,比前一版本更出色。

上下文 131K¥1.46 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

Qwen3 Next 80B A3B Instruct

#123

alibaba

Qwen3驱动的新一代开源非思维模式模型。提升中文理解、逻辑推理和文本生成能力。

上下文 131K¥1.46 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

Kimi K2 Turbo

#124

moonshotai

Kimi K2 Turbo是kimi-k2的高速版,输出速度提升至60 tokens每秒,最高100 tokens每秒,上下文长度256k。

上下文 256K¥11.20 / 100万 tokens¥77.94 / 100万 tokens开始对话 →

Kimi K2 Instruct

#125

moonshotai

Kimi K2是32亿激活参数、1万亿参数的尖端Mixture-of-Experts模型,具备出色的推理和编码能力。

上下文 131K¥5.55 / 100万 tokens¥22.41 / 100万 tokens开始对话 →

Nano Banana Pro (Gemini 3 Pro Image)

#126

google

Nano Banana Pro(Gemini 3 Pro Image)支持高质量图像创建与编辑,增强世界知识、推理和多语言能力,提供专业级控制。

上下文 66K¥19.49 / 100万 tokens¥116.91 / 100万 tokens开始对话 →

Bytedance Seed 1.8

#127

bytedance

Seed 1.8增强多模理解和代理能力,在复杂任务中表现优越,助力企业创造价值。

上下文 256K¥2.44 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

Seed 1.6

#128

bytedance

支持文本和视觉输入的多模深度思考模型,增强推理能力。

上下文 256K¥2.44 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

Seedream 4.0

#129

bytedance

Seedream 4.0多模图像生成模型,支持多种输入类型,整合文本和图片,实现多样创意和可控生成。

上下文 —N/AN/A开始对话 →

DeepSeek V3.1

#130

deepseek

DeepSeek-V3.1在V3基础上扩展长文本能力,经过两阶段长上下文增强训练,丰富数据集。

上下文 164K¥5.46 / 100万 tokens¥16.37 / 100万 tokens开始对话 →

Nvidia Nemotron Nano 9B V2

#131

nvidia

NVIDIA Nemotron Nano 9B-v2是全新训练的大型模型,结合推理和非推理任务,能生成推理轨迹并给出最终答案。

上下文 131K¥0.5846 / 100万 tokens¥2.24 / 100万 tokens开始对话 →

GLM 4.5V

#133

zai

基于GLM-4.5-Air,采用强大106B参数Mixture-of-Experts架构,继承GLM-4.1V的成功技术。

上下文 66K¥5.85 / 100万 tokens¥17.54 / 100万 tokens开始对话 →

GPT-5 mini

#135

openai

GPT-5 Mini成本优化,擅长推理和对话任务,实现速度、成本和能力的平衡。

上下文 400K¥2.44 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

GPT-5 nano

#136

openai

GPT-5 Nano高速模型,擅长简单指令和分类任务。

上下文 400K¥0.4871 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

GPT 5 Chat

#137

openai

GPT-5 Chat是ChatGPT中使用的GPT-5快照版本。

上下文 128K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

GPT OSS 120B

#138

openai

120B模型,擅长科学、数学和编码推理,适合实时编码、处理大文档、研究工作和本地部署。

上下文 131K¥3.41 / 100万 tokens¥7.31 / 100万 tokens开始对话 →

GPT OSS 20B

#139

openai

紧凑的开源模型,优化低延迟和资源受限环境,包括本地和边缘设备。

上下文 131K¥0.4871 / 100万 tokens¥1.95 / 100万 tokens开始对话 →

Claude Opus 4

#140

anthropic

Claude Opus 4 是 Anthropic 最强大的模型,也是全球最佳的编码模型,在 SWE-bench 和 Terminal-bench 方面领先。能够长时间连续工作,表现优异。

上下文 200K¥146.14 / 100万 tokens¥730.71 / 100万 tokens开始对话 →

GPT-5

#141

openai

GPT-5 是 OpenAI 的旗舰语言模型,擅长复杂推理、广泛知识、代码密集和多步骤任务。

上下文 400K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

GLM-4.5

#142

zai

GLM-4.5 和 GLM-4.5-Air 是最新的旗舰模型,面向代理应用。都采用 Mixture-of-Experts 架构,参数量庞大,性能强大。

上下文 128K¥5.85 / 100万 tokens¥21.43 / 100万 tokens开始对话 →

GLM 4.5 Air

#143

zai

同上,专为代理应用设计,参数较少,结构更简洁。

上下文 128K¥1.95 / 100万 tokens¥10.72 / 100万 tokens开始对话 →

Qwen3 Coder Plus

#144

alibaba

Qwen3 编码代理,擅长工具调用和环境交互,支持自主编程。

上下文 1000K¥9.74 / 100万 tokens¥48.71 / 100万 tokens开始对话 →

Qwen3 Coder Next

#145

alibaba

Qwen3-Coder-Next 为专门面向编码的开源模型,适用于软件工程和代理编码,支持多语言代码任务。

上下文 256K¥4.87 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

Grok 4.1 Fast Non-Reasoning

#146

xai

Grok 4.1 Fast,工具调用模型,速度快,适用于复杂实际场景,优化速度。使用此版本。

上下文 1000K¥1.95 / 100万 tokens¥4.87 / 100万 tokens开始对话 →

Grok 4.1 Fast Reasoning

#147

xai

Grok 4.1 Fast,工具调用模型,推理能力强,适合复杂任务,优化智能。使用此版本。

上下文 1000K¥1.95 / 100万 tokens¥4.87 / 100万 tokens开始对话 →

Gemini 2.5 Flash Lite

#148

google

Gemini 2.5 Flash-Lite,低延迟、可配置思考预算和工具连接,支持多模态,1M token 上下文。

上下文 1049K¥0.9743 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

Seedance v1.0 Pro

#149

bytedance

支持多场景故事的视频生成模型,理解力强,输出细腻、电影级1080P视频。

上下文 —N/AN/A开始对话 →

Seedance v1.0 Lite Text-to-Video

#152

bytedance

基于文本描述生成视频,平衡质量与速度,支持多分辨率,风格多样。

上下文 —N/AN/A开始对话 →

FLUX.1 Kontext Pro

#153

bfl

FLUX.1 Kontext,用于文本生成图像,支持角色一致性和高级编辑,无需复杂流程,提供安全调节。

上下文 1KN/AN/A开始对话 →

Imagen 4 Fast

#154

google

Imagen 4 Fast,谷歌快速版高效图像生成模型,适合快速草图和创作,支持高分辨率。

上下文 0KN/AN/A开始对话 →

FLUX.1 Kontext Max

#155

bfl

同上,强调角色一致性和高级编辑,无需复杂流程,可调节安全等级。

上下文 1KN/AN/A开始对话 →

Seedance v1.0 Lite Image-to-Video

#156

bytedance

能根据图像/文本描述、首尾帧和参考图像生成视频,平衡质量与速度,具有强语义理解和专业摄像效果,支持480p/720p/1080p,时长3-12秒。

上下文 —N/AN/A开始对话 →

Codestral Embed

#157

mistral

代码嵌入模型,可嵌入代码数据库和仓库,用于支持编码助手。

上下文 —¥1.46 / 100万 tokensN/A开始对话 →

Imagen 4 Ultra

#158

google

Imagen 4 Ultra:最高品质的图像生成模型,能生成详细逼真的图片。

上下文 0KN/AN/A开始对话 →

Claude Sonnet 4

#159

anthropic

Claude Sonnet 4在Sonnet 3.7基础上大幅提升,编码能力达到SWE-bench的72.7%,性能与效率兼顾,操控性增强,适合多场景使用。

上下文 1000K¥29.23 / 100万 tokens¥146.14 / 100万 tokens开始对话 →

Claude Opus 4.1

#160

anthropic

Claude Opus 4.1是Opus 4的升级版,提供更优性能与精准度,处理复杂多步任务表现更佳,SWE-bench达74.5%。

上下文 200K¥146.14 / 100万 tokens¥730.71 / 100万 tokens开始对话 →

Imagen 4

#161

google

Imagen 4是谷歌的旗舰文本转图像模型,支持高达2K的图片生成,效果细腻清晰,适用于营销与艺术创作。

上下文 0KN/AN/A开始对话 →

Voyage 3.5

#163

voyage

Voyage AI的嵌入模型,优化于通用和多语种检索。

上下文 —¥0.5846 / 100万 tokensN/A开始对话 →

Voyage 3.5 Lite

#164

voyage

Voyage AI的轻量级嵌入模型,注重低延迟与低成本。

上下文 —¥0.1949 / 100万 tokensN/A开始对话 →

GPT-4.1 mini

#165

openai

GPT 4.1 mini在智能、速度和成本间取得平衡,适用多场景。

上下文 1048K¥3.90 / 100万 tokens¥15.59 / 100万 tokens开始对话 →

Devstral Small 2

#166

mistral

开源模型,擅长使用工具探索代码库、编辑多个文件和驱动软件工程代理。

上下文 256K¥0.9743 / 100万 tokens¥2.92 / 100万 tokens开始对话 →

Mistral Medium 3.1

#167

mistral

Mistral Medium 3提供一流水平,成本低,性能接近Claude Sonnet 3.7,表现优异。

上下文 128K¥3.90 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

Devstral Small 1.1

#168

mistral

Devstral是由Mistral AI和All Hands AI合作开发的工程任务代理模型,擅长探索代码、编辑文件和推动开发代理。

上下文 128K¥0.9743 / 100万 tokens¥2.92 / 100万 tokens开始对话 →

o4-mini

#169

openai

OpenAI的o4-mini模型,响应迅速、成本低,适合数学、编码和视觉任务,表现优异。

上下文 200K¥10.72 / 100万 tokens¥42.87 / 100万 tokens开始对话 →

o3

#170

openai

OpenAI的o3模型,最强的推理能力,在编码、数学、科学和视觉感知方面表现卓越,善于处理复杂多面分析。

上下文 200K¥19.49 / 100万 tokens¥77.94 / 100万 tokens开始对话 →

o3 Pro

#171

openai

o3-pro是反复强化学习训练的模型,能深度思考并提供更优答案。

上下文 200K¥194.86 / 100万 tokens¥779.43 / 100万 tokens开始对话 →

Embed v4.0

#172

cohere

支持文本、图片或混合内容的分类或嵌入模型。

上下文 —¥1.17 / 100万 tokensN/A开始对话 →

GPT-4.1 nano

#173

openai

GPT-4.1 nano是速度最快、成本最低的GPT 4.1模型。

上下文 1048K¥0.9743 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

GPT-4.1

#174

openai

GPT 4.1 是 OpenAI 的旗舰模型,适合复杂任务的多领域问题解决。

上下文 1048K¥19.49 / 100万 tokens¥77.94 / 100万 tokens开始对话 →

Llama 4 Maverick 17B Instruct

#175

meta

Llama 4 Maverick 是通用大模型,含有170亿参数,性能高且价格较低。

上下文 128K¥2.34 / 100万 tokens¥9.45 / 100万 tokens开始对话 →

Llama 4 Scout 17B Instruct

#176

meta

Llama 4 Scout 是同类中最强的多模态模型,支持多达10M tokens的上下文窗口。

上下文 128K¥1.66 / 100万 tokens¥6.43 / 100万 tokens开始对话 →

Qwen3 Coder 480B A35B Instruct

#177

alibaba

Qwen3-Coder-480B-A35B-Instruct 是领先的开源编码模型,在编程和自动化任务中表现优异。

上下文 262K¥14.61 / 100万 tokens¥73.07 / 100万 tokens开始对话 →

Qwen 3 Coder 30B A3B Instruct

#178

alibaba

高效编码专家,兼顾性能与成本,适合日常开发和工具集成。

上下文 262K¥1.46 / 100万 tokens¥5.85 / 100万 tokens开始对话 →

Qwen3 235B A22B

#179

alibaba

Qwen3-235B-A22B-Instruct-2507 是升级版,改善指令遵循、推理、文本理解、数学等能力。

上下文 262K¥2.14 / 100万 tokens¥8.57 / 100万 tokens开始对话 →

Qwen3-14B

#180

alibaba

Qwen3 是系列中最新一代大模型,增强推理、指令遵循、多语言和代理能力。

上下文 41K¥1.17 / 100万 tokens¥2.34 / 100万 tokens开始对话 →

Qwen3 VL 235B A22B Thinking

#181

alibaba

Qwen3系列 VL 模型显著提升多模态推理能力,特别强调STEM和数学推理,增强视觉识别和OCR能力。

上下文 131K¥3.90 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

Qwen 3 32B

#182

alibaba

Qwen3-32B 性能媲美 DeepSeek R1,优于 GPT-4.1 和 Claude Sonnet 3.7,擅长代码生成和复杂推理。

上下文 128K¥1.56 / 100万 tokens¥6.24 / 100万 tokens开始对话 →

Qwen3-30B-A3B

#183

alibaba

Qwen3 是系列中最新的大模型,涵盖多模态和专家混合,推动推理和多语言发展。

上下文 41K¥1.17 / 100万 tokens¥4.87 / 100万 tokens开始对话 →

GPT Image 1

#184

openai

GPT Image 1 是 OpenAI 的先进图像生成模型,支持文本和图像输入,输出图像。

上下文 —¥48.71 / 100万 tokens¥389.71 / 100万 tokens开始对话 →

Gemini 2.5 Flash

#185

google

Gemini 2.5 Flash 具备全面能力,平衡价格与性能,支持多模态和1M tokens上下文。

上下文 1000K¥2.92 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Gemini 2.5 Pro

#186

google

Gemini 2.5 Pro 为最先进的推理模型,能处理复杂问题,理解多种类型数据。

上下文 1049K¥12.18 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

Nano Banana (Gemini 2.5 Flash Image)

#187

google

Nano Banana(Gemini 2.5 Flash Image)是谷歌首个全混合推理模型,支持动态思维调节、图像生成和多轮对话。

上下文 33K¥2.92 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Magistral Medium 2509

#188

mistral

Magistral-Medium 具备深刻理解和透明推理,擅长多语种对答,确保推理可靠。

上下文 128K¥19.49 / 100万 tokens¥48.71 / 100万 tokens开始对话 →

Magistral Small 2509

#189

mistral

Magistral-Small以深层理解为基础,支持多语种推理,推理清晰可靠。

上下文 128K¥4.87 / 100万 tokens¥14.61 / 100万 tokens开始对话 →

Command A

#190

cohere

Command A 是 Cohere 性能最强模型,擅长工具用、代理、RAG 和多语言,支持256K上下文,效率高。

上下文 256K¥24.36 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

GPT 4o Mini Search Preview

#191

openai

GPT-4o Mini 搜索预览专为理解与执行网页搜索查询设计,按工具调用收费。

上下文 128K¥1.46 / 100万 tokens¥5.85 / 100万 tokens开始对话 →

Mercury Coder Small Beta

#192

inception

Mercury Coder Small 适用于代码生成、调试和重构任务,延迟极低。

上下文 32K¥2.44 / 100万 tokens¥9.74 / 100万 tokens开始对话 →

DeepSeek-R1

#193

deepseek

DeepSeek-R1 提供先进推理模型,优化用于推理、数学、科学和代码生成。

上下文 128K¥13.15 / 100万 tokens¥52.61 / 100万 tokens开始对话 →

Trinity Large Preview

#194

arcee-ai

Trinity Large 预览版(未正式发布)是一个拥有4000亿参数(13亿激活单元)的稀疏专家混合语言模型,高效扩展,擅长推理、编码和多步工作流程。

上下文 131K¥2.44 / 100万 tokens¥9.74 / 100万 tokens开始对话 →

GLM 4.7 FlashX

#195

zai

GLM-4.7-Flash 性能优异且高效,是理想的轻量部署选择。

上下文 200K¥0.5846 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

DeepSeek V3 0324

#196

deepseek

快速通用大型语言模型,增强推理能力。

上下文 164K¥2.63 / 100万 tokens¥10.91 / 100万 tokens开始对话 →

o3-mini

#197

openai

o3-mini 是 OpenAI 最新的小型推理模型,提供高智慧,延迟和成本与 o1-mini 相同。

上下文 200K¥10.72 / 100万 tokens¥42.87 / 100万 tokens开始对话 →

Llama 3.3 70B Instruct

#198

meta

性能与效率兼备,支持高性能对话AI,用于内容创作、企业应用和科研,具备高级语言理解能力。

上下文 128K¥7.01 / 100万 tokens¥7.01 / 100万 tokens开始对话 →

o1

#199

openai

o1 是 OpenAI 旗舰推理模型,应对复杂问题,具备深度推理和多步任务的高准确率。

上下文 200K¥146.14 / 100万 tokens¥584.57 / 100万 tokens开始对话 →

Nova Lite

#200

amazon

极低成本、多模态模型,快速处理图像、视频和文本输入,生成文本。

上下文 300K¥0.5846 / 100万 tokens¥2.34 / 100万 tokens开始对话 →

Nova Pro

#201

amazon

性能卓越的多模态模型,平衡准确性、速度和成本,适用多种任务。

上下文 300K¥7.79 / 100万 tokens¥31.18 / 100万 tokens开始对话 →

GPT OSS Safeguard 20B

#202

openai

OpenAI 首个开源重量推理模型,专为安全分类训练,可定制策略,实现信任与安全AI决策。

上下文 131K¥0.7307 / 100万 tokens¥2.92 / 100万 tokens开始对话 →

Nova 2 Lite

#203

amazon

Nova 2 Lite 经济高效、响应快的推理模型,处理文本、图像和视频,生成文本。

上下文 1000K¥2.92 / 100万 tokens¥24.36 / 100万 tokens开始对话 →

Nvidia Nemotron Nano 12B V2 VL

#204

nvidia

自动回归视觉语言模型,支持多图像推理、视频理解、文档智能、视觉问答和摘要。

上下文 131K¥1.95 / 100万 tokens¥5.85 / 100万 tokens开始对话 →

Nemotron 3 Nano 30B A3B

#205

nvidia

开源推理模型,优化快、成本低,适合多步推理,性能稳定。

上下文 262K¥0.4871 / 100万 tokens¥2.34 / 100万 tokens开始对话 →

Claude Opus 4.5

#206

anthropic

最新的 Opus 系列模型,用于复杂推理和问题解决,擅长编码任务和外部记忆处理。

上下文 200K¥48.71 / 100万 tokens¥243.57 / 100万 tokens开始对话 →

Pixtral Large

#207

mistral

多模态模型,能理解文档、图表和自然图像,保持文本文本理解领先。

上下文 128K¥19.49 / 100万 tokens¥58.46 / 100万 tokens开始对话 →

FLUX1.1 [pro] Ultra

#208

bfl

超快高分辨率图像生成,支持不同宽高比,安全性可调。

上下文 —N/AN/A开始对话 →

Ministral 3B

#209

mistral

紧凑高效模型,适合设备上的智能助手和本地分析,低延迟。

上下文 128K¥0.9743 / 100万 tokens¥0.9743 / 100万 tokens开始对话 →

Ministral 8B

#210

mistral

更强大,用于复杂流程和边缘应用,推理快且节省内存。

上下文 128K¥1.46 / 100万 tokens¥1.46 / 100万 tokens开始对话 →

Recraft V3

#211

recraft

先进的照片写实和文本渲染,能准确生成中等大小文字,能定位文本位置。

上下文 —N/AN/A开始对话 →

FLUX.1 Fill [pro]

#212

bfl

图像修补模型,可编辑和扩展真实或生成的图片,支持文本描述和二进制掩码。

上下文 —N/AN/A开始对话 →

FLUX1.1 [pro]

#213

bfl

快速可靠的文本转图像模型,效果稳定震撼。

上下文 —N/AN/A开始对话 →

Llama 3.2 11B Vision Instruct

#214

meta

针对视觉识别、推理、字幕和问答优化的指导调优图片推理生成模型。

上下文 128K¥1.56 / 100万 tokens¥1.56 / 100万 tokens开始对话 →

Llama 3.2 90B Vision Instruct

#215

meta

大型指导调优图片推理模型,支持多任务。

上下文 128K¥7.01 / 100万 tokens¥7.01 / 100万 tokens开始对话 →

Llama 3.2 3B Instruct

#216

meta

支持多语言本地知识检索、摘要和改写的纯文本模型。

上下文 128K¥1.46 / 100万 tokens¥1.46 / 100万 tokens开始对话 →

Llama 3.2 1B Instruct

#217

meta

支持多语言本地知识检索、摘要和改写的纯文本模型。

上下文 128K¥0.9743 / 100万 tokens¥0.9743 / 100万 tokens开始对话 →

Mistral Small

#218

mistral

适合批量简单任务,如分类、客户支持、文本生成,性能优异,价格实惠。

上下文 32K¥0.9743 / 100万 tokens¥2.92 / 100万 tokens开始对话 →

voyage-3-large

#219

voyage

最佳通用和多语种检索质量的嵌入模型。

上下文 —¥1.75 / 100万 tokensN/A开始对话 →

Pixtral 12B 2409

#220

mistral

拥有图像理解能力的12B模型,除了文本外还能理解图片。

上下文 128K¥1.46 / 100万 tokens¥1.46 / 100万 tokens开始对话 →

Voyage Code 3

#221

voyage

专为代码检索优化的嵌入模型。

上下文 —¥1.75 / 100万 tokensN/A开始对话 →

Morph V3 Fast

#222

morph

Morph 提供一种专用的 AI 模型,快速应用前沿模型(如 Claude 或 GPT-4o)建议的代码更改,速度超过 4500 个 tokens/秒。支持 16k 输入和输出 tokens。

上下文 82K¥7.79 / 100万 tokens¥11.69 / 100万 tokens开始对话 →

Morph V3 Large

#223

morph

Morph 提供一种专用的 AI 模型,快速应用前沿模型(如 Claude 或 GPT-4o)建议的代码更改,速度超过 2500 个 tokens/秒。支持 16k 输入和输出 tokens。

上下文 82K¥8.77 / 100万 tokens¥18.51 / 100万 tokens开始对话 →

Llama 3.1 8B Instruct

#225

meta

Meta Llama 3 8B 指令模型的升级版,扩展到 128K 上下文长度,支持多语言,提高推理能力。

上下文 128K¥2.14 / 100万 tokens¥2.14 / 100万 tokens开始对话 →

Llama 3.1 70B Instruct

#226

meta

Meta Llama 3 70B 指令模型的升级版,扩展到 128K 上下文长度,支持多语言,提高推理能力。

上下文 128K¥7.01 / 100万 tokens¥7.01 / 100万 tokens开始对话 →

GPT-4o mini

#227

openai

OpenAI 的 GPT-4o mini 是最先进且成本效益最高的小型模型。多模态(支持文本或图像输入,输出文本),比 GPT-3.5-turbo 智能更高,但速度相同。

上下文 128K¥1.46 / 100万 tokens¥5.85 / 100万 tokens开始对话 →

Mistral Nemo 12B

#228

mistral

由 Mistral AI 和 NVIDIA 共同训练的 12B 模型,显著优于同等或较小的模型。

上下文 131K¥0.1949 / 100万 tokens¥0.3897 / 100万 tokens开始对话 →

o3-deep-research

#229

openai

OpenAI 最先进的深研模型,设计处理复杂多步骤的研究任务。能搜索和合成互联网及自有数据的信息。

上下文 200K¥97.43 / 100万 tokens¥389.71 / 100万 tokens开始对话 →

Mistral Codestral

#230

mistral

Mistral 2025 年底发布的尖端编码语言模型,专注低延迟和高频任务,如中间填充(FIM)、代码修正和测试生成。

上下文 128K¥2.92 / 100万 tokens¥8.77 / 100万 tokens开始对话 →

GPT-4o

#231

openai

OpenAI 的 GPT-4o 具有广泛的知识和专业能力,能理解复杂指令,解决难题,性能等同于 GPT-4 Turbo,API 更快更便宜。

上下文 128K¥24.36 / 100万 tokens¥97.43 / 100万 tokens开始对话 →

Titan Text Embeddings V2

#232

amazon

Amazon Titan 文本嵌入 V2,轻量高效,支持多语言,维度有 1024、512 和 256。

上下文 —¥0.1949 / 100万 tokensN/A开始对话 →

Voyage Law 2

#234

voyage

Voyage AI 的法律检索和 RAG 优化嵌入模型。

上下文 —¥1.17 / 100万 tokensN/A开始对话 →

Voyage Finance 2

#235

voyage

Voyage AI 的金融检索和 RAG 优化嵌入模型。

上下文 —¥1.17 / 100万 tokensN/A开始对话 →

Recraft V2

#236

recraft

Recraft 2024 年 3 月发布的图像生成模型,首个由 Recraft 从零训练,拥有 200 亿参数,支持品牌一致性、色彩输入、向量图(SVG)输出及简约风格。

上下文 —N/AN/A开始对话 →

Voyage Code 2

#239

voyage

Voyage AI 针对代码检索优化的嵌入模型(比替代品好 17%),为上一代模型。

上下文 —¥1.17 / 100万 tokensN/A开始对话 →

Mistral Embed

#240

mistral

通用文本嵌入模型,用于语义搜索、相似性、聚类和RAG流程。

上下文 —¥0.9743 / 100万 tokensN/A开始对话 →

Claude 3.5 Haiku

#241

anthropic

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型,响应迅速。能处理图像并返回文本,有200K上下文窗口。

上下文 200K¥7.79 / 100万 tokens¥38.97 / 100万 tokens开始对话 →

GPT-4 Turbo

#242

openai

OpenAI 的 GPT-4 Turbo 具有广泛的知识和领域专长,能理解复杂指令,解决难题。知识截止到2023年4月,拥有128,000词的上下文窗口。

上下文 128K¥97.43 / 100万 tokens¥292.29 / 100万 tokens开始对话 →

GPT-3.5 Turbo Instruct

#243

openai

功能与GPT-3模型相似。兼容旧的Completions接口,不支持Chat Completions。

上下文 8K¥14.61 / 100万 tokens¥19.49 / 100万 tokens开始对话 →

GPT-3.5 Turbo

#244

openai

GPT-3.5家庭中最强大且性价比最高的模型,适合聊天和传统补全任务。

上下文 16K¥4.87 / 100万 tokens¥14.61 / 100万 tokens开始对话 →

Claude 3 Haiku

#245

anthropic

Claude 3 Haiku 是 Anthropic 最快、最紧凑的模型,响应迅速。能处理图像并返回文本,有200K上下文窗口。

上下文 200K¥2.44 / 100万 tokens¥12.18 / 100万 tokens开始对话 →

Voyage 4 Lite

#247

voyage

为低延迟和低成本优化的模型。所有4系列嵌入互通。

上下文 32K¥0.1949 / 100万 tokensN/A开始对话 →

Voyage 4 Large

#248

voyage

最佳的通用和多语言检索质量。全部4系列嵌入互通。

上下文 32K¥1.17 / 100万 tokensN/A开始对话 →

GLM 4.7 Flash

#249

zai

GLM-4.7-Flash 在性能和效率间平衡,适合轻量部署。推荐用于编码、创作文、翻译、长上下文和角色扮演。

上下文 200K¥0.6820 / 100万 tokens¥3.90 / 100万 tokens开始对话 →

Nova Micro

#250

amazon

仅文本模型,响应最低延迟,成本极低。

上下文 128K¥0.3410 / 100万 tokens¥1.36 / 100万 tokens开始对话 →

Qwen 3 Max Thinking

#251

alibaba

Qwen-3 Max 在思考与非思考模式的整合上有显著提升。支持网页搜索、信息提取和代码解释,能应对复杂问题。基于2026年1月23日的快照。

上下文 256K¥11.69 / 100万 tokens¥58.46 / 100万 tokens开始对话 →

Qwen3 VL 235B A22B Instruct

#252

alibaba

Qwen3 VL模型在视觉编码和空间感知方面全面升级,支持超长视频理解,OCR功能增强。

上下文 131K¥3.90 / 100万 tokens¥15.59 / 100万 tokens开始对话 →

Voyage 4

#253

voyage

为通用和多语言检索优化,互通兼容。

上下文 32K¥0.5846 / 100万 tokensN/A开始对话 →

GPT-5 pro

#254

openai

GPT-5 Pro 运用更多算力,思考更深,回答更好。处理难题可能需要几分钟。

上下文 400K¥146.14 / 100万 tokens¥1169.14 / 100万 tokens开始对话 →

FLUX.2 [pro]

#255

bfl

FLUX.2为视觉智能全新基础模型,支持高质量、多解析度(最高4MP)、多引用图像(最多9 MP)。可调节输入输出审核等级。

上下文 67KN/AN/A开始对话 →

FLUX.2 [flex]

#256

bfl

FLUX.2支持自定义图像生成和编辑,支持多参考图像(最多14 MP输入),字体和文本渲染更优。可调节审核等级。

上下文 —N/AN/A开始对话 →

Veo 3.0 Fast Generate

#257

google

Veo 3 Fast是Veo 3的加快版,适合开发快速、经济的视频生成,支持文本到视频和图像到视频。

上下文 —N/AN/A开始对话 →

Veo 3.1

#258

google

Veo 3.1 是谷歌的先进模型,用于生成高保真的8秒视频,支持720p、1080p或4K分辨率,具有逼真的画面和原生音频。

上下文 —N/AN/A开始对话 →

FLUX.2 [max]

#259

bfl

FLUX.2 [max] 提供高质量的图像生成和编辑,适用于专业用途,输出可用于市场营销、创意、电影制作等。

上下文 67KN/AN/A开始对话 →

FLUX.2 [klein] 9B

#260

bfl

FLUX.2 [klein] 是Black Forest Labs最快的图像模型,能在不到一秒时间内完成图像生成和编辑,支持互动工作流程和实时预览。

上下文 —N/AN/A开始对话 →

FLUX.2 [klein] 4B

#261

bfl

FLUX.2 [klein] 是Black Forest Labs最快的图像模型,支持单一模型内的生成与编辑,快速高质量,适合实时应用。

上下文 —N/AN/A开始对话 →

Veo 3.1 Fast Generate

#262

google

Veo 3.1 Fast 是谷歌DeepMind的Veo 3.1的高速变体,优化快速生成8秒高保真视频,支持高质量内容创作和原生音频。

上下文 —N/AN/A开始对话 →

Veo 3.0

#263

google

Veo 3 能处理多种视频生成任务,从电影故事到动态角色动画,支持生成视觉与音频内容。

上下文 —N/AN/A开始对话 →

Flux Schnell

#264

prodia

极快的图像生成

上下文 1KN/AN/A开始对话 →