链世界
网站首页
网站导航
文章列表
AI 模型榜
实用工具
像素广场
设置
联系我们RSS友情链接提交网站
隐私政策·免责声明
陕ICP备2025083618号-2

热门频道

AI 工具开发工具效率工具招聘求职安全工具
导航文章工具
返回首页

AI 模型排行榜 · 链世界

按对话、图像、视频三类展示主流模型的综合分与扩展指标,支持切换排序维度。排名由站点运营维护,仅供参考。

排名模型厂商
综合分运营维护的综合排名分,越高越靠前
上下文 (K)上下文窗口长度(千 tokens)
输入价输入 tokens 单价(美元/百万 tokens)
输出价输出 tokens 单价(美元/百万 tokens)
MMLU大规模多任务语言理解基准准确率(%),越高越好
HumanEval代码生成能力评测 HumanEval(%),越高越好
Elo竞技场人类偏好对战 Elo 分,越高表示实战表现越强
1
G
GPT-5.5
—98.0105053091.5091.401420
2
C
Claude Fable 5
Anthropic 最强模型,定位高于 Opus 层级。Mythos 级别公开版,1M 上下文,SWE-Bench 等多项基准超越 Opus 4.8 超过 10%。支持自适应思维模式。
Anthropic97.010001050———
3
G
Gemini 3.5 Pro
Google DeepMind96.010001.5099189.501400
4
C
Claude Opus 4.8
Anthropic 最新旗舰推理模型
Anthropic95.010005250—0
5
C
Claude Opus 4.7
—93.010005259192.501400
6
G
GLM-5.2
开源推理模型新标杆,MIT 许可,AA Intelligence Index 51 分位居开源模型榜首。MoE 架构 753B 总参数/40B 活跃参数,1M 上下文。GDPval-AA v2 得分 1524,与 GPT-5.5(1514)持平。科学推理能力突出:GPQA Diamond 89%,HLE 40%。
智谱AI / Z.ai91.010001.404.40———
7
C
Claude Opus 4.6
Anthropic 1M 上下文推理模型,标准版 $5/$25,快速版 $30/$150
Anthropic90.010005250—0
8
G
GPT-5.4 Pro
OpenAI最强推理模型,1M+上下文,已解决前沿数学难题(Ramsey超图、Erdős问题)
OpenAI90.0105030180———
9
G
Gemini 3.5 Flash
Google 轻量级旗舰模型,支持 Computer Use 屏幕操控、函数调用、Search/Maps Grounding,适合 Agent 场景
Google DeepMind90.010491.50992.3086.801370
10
G
GPT-5.5 Instant
OpenAI88.09220.75389.5088.201350
11
V
VibeThinker-3B
3B参数稠密推理模型,AIME26得分94.3,基于Qwen2.5,采用Spectrum-to-Signal后训练范式。不支持工具调用,专注数学和代码推理。
Weibo AI88.032—————
12
D
DeepSeek V4 Pro
深度推理模型,MIT 开源许可,1M 上下文窗口,MoE 架构 1.6T 总参数/49B 活跃参数。AA Intelligence Index 44 分,仅次于 GLM-5.2 的开源模型第二名。缓存命中价格极低($0.004/M tokens)。
DeepSeek (深度求索)87.010000.430.87———
13
K
Kimi K2.7 Code
1T MoE 编程专用模型,256K 上下文,Modified MIT 开源,推理 token 消耗降低 30%
月之暗面 / Moonshot AI85.02560.743.50———
14
Q
Qwen3.7 Max
—85.010001.253.7587871300
15
G
Gemini 3.1 Pro
—85.0104921287.50851300
16
D
DeepSeek V4 Flash
高性价比推理模型,MIT 开源许可,1M 上下文窗口,MoE 架构 284B 总参数/13B 活跃参数。AA Intelligence Index 40 分,输出价格仅 $0.28/M tokens,缓存命中 $0.003/M tokens,极致性价比。
DeepSeek (深度求索)83.010000.140.28———
17
G
Grok 4.20 Multi-Agent
xAI 多智能体推理模型,基于 Grok 4.20 构建,支持多 Agent 协作编排,2M 上下文,适合复杂任务分解与并行执行
xAI82.020001.252.5086851275
18
C
Cursor Composer 2.5
Cursor82.02560085861260
19
K
Kimi K2.6
—82.02620.683.4285.5084.501280
20
G
GPT-5.4
—82.010502.501588.2087.501320
21
G
Grok 4.20
xAI推理模型,2M上下文,最低幻觉率,支持Agent工具调用
xAI81.020001.252.50———
22
C
Claude Sonnet 4.6
Anthropic80.0100031586.50881280
23
M
MiniMax M3
首个开源权重模型同时具备前沿编码、1M 上下文和原生多模态能力。MSA 稀疏注意力架构,SWE-Bench Pro 59.0%,TerminalBench 66.0%。定价极具竞争力。
MiniMax (稀宇科技)80.010000.301.20———
24
W
Windsurf SWE-1.6
Windsurf (Codeium)80.020000000
25
G
Grok 4.3
—80.010001.252.5086851270
26
M
MiMo-V2.5 Pro
Xiaomi78.010000.440.8885841260
27
Q
Qwen3.6 Plus
—76.010000.331.9584841250
28
G
GPT-4o
OpenAI75.01282.501088.7090.201287
29
Q
Qwen3.7 Plus
阿里通义千问3.7系列性价比模型,1M上下文,支持多模态Agent
Alibaba (Qwen)75.010000.321.28———
30
G
GLM-5.1
智谱AI (Zhipu)75.02000.401.2083821240
31
C
Cursor Composer 2
Cursor72.02560082821220
32
M
MiMo-V2.5
—72.010490.150.29———
33
M
MiniMax-M2.7
—72.02050.281.2082811220
34
K
Kimi K2.5
—72.02620.401.9082821220
35
G
Gemini 3 Flash
Google DeepMind70.010000.150.608280.501220
36
G
GLM-5
智谱AI (Zhipu)70.02000.300.9081791210
37
Q
Qwen3.5 397B
Alibaba (Qwen)68.02620.451.3580.5080.501200
38
G
GPT-5.4 Mini
GPT-5.4高效变体,400K上下文,优化高吞吐场景
OpenAI67.04000.754.50———
39
Q
Qwen3 Coder 480B
Qwen 最强开源编码模型,480B MoE 架构(35B 激活),原生 256K 上下文(YaRN 可扩展至 1M)。SWE-Bench 表现优异,Apache 2.0 开源。配套 Qwen Code CLI 工具。
Alibaba (Qwen)66.02560.221.80———
40
G
Gemini 2.5 Pro
Google DeepMind65.010000.351.4080.50781180
41
G
Grok 3
xAI65.010000.150.6080801180
42
混
混元 Hy3 Preview
腾讯混元65.02560.060.1879781180
43
D
DeepSeek V3.2
DeepSeek V3 系列最新版,131K 上下文,高性价比
DeepSeek (深度求索)63.01310.230.340—0
44
C
Claude 4.5 Haiku
Anthropic60.02000.80478751150
45
G
Gemini 3.1 Flash Lite
Google 超低价 1M 上下文模型,适合大批量处理
Google DeepMind60.010490.251.500—0
46
C
Codestral 2508
Mistral 代码专用模型,256K上下文,低定价
Mistral AI60.02560.300.900—0
47
S
Step 3.7 Flash
StepFun 最新多模态 MoE 模型,196B 参数语言骨干 + 视觉编码器,原生支持图像和视频理解
StepFun (阶跃星辰)60.02560.201.157875—
48
G
GPT-5.4 Nano
GPT-5.4最轻量变体,400K上下文,极速低成本
OpenAI58.04000.201.25———
49
C
Cursor Composer 1.5
Cursor58.02000076741150
50
D
DeepSeek R1
DeepSeek55.01280.552.1978.5078.501100
51
N
Nova 2.0 Pro
Amazon55.02560.803.2076721120
52
N
Nemotron 3 Super
NVIDIA55.010000.140.4276741120
53
M
Mistral Large 2512
Mistral Large 2025年12月更新版,262K上下文,定价大幅下降
Mistral AI55.02620.501.500—0
54
M
Mistral Medium 3.5
Mistral 中端模型,262K上下文
Mistral AI55.02621.507.500—0
55
S
Step 3.5 Flash
StepFun (阶跃星辰)55.02560.030.0975721100
56
豆
豆包 Seed Code
字节跳动 (ByteDance)55.02560.100.3076741120
57
M
Mistral Large 3
Mistral AI50.02560.300.9075701100
58
G
Grok Build 0.1
xAI 编程专用模型,专为代理式软件工程工作流优化,支持文本和图像输入
xAI50.025612———
59
C
Command A+
Cohere48.0128000—0
60
L
Llama 4 Maverick
Meta45.010000.170.5072721080
61
E
ERNIE 5.0 Thinking
百度 (Baidu)45.01280.250.7570681050
62
L
Llama 4 Scout
Meta35.0100000.110.3365651000
63
M
Mistral Small 4
Mistral AI35.02560.100.306562980
64
C
Command A
Cohere35.02561.504.506260970
65
P
Phi-4
Microsoft30.0160.080.246065950
66
J
Jamba 1.7 Large
AI21 Labs30.02561.303.905860930

免责声明

本排行榜由 LinkWord 站点运营人工整理与更新,综合分、基准测试分数、价格与能力指标等仅供浏览与横向对比参考,不构成购买建议、性能承诺或商业背书。数据可能滞后于厂商官方发布,不同评测方法、版本与使用场景下结果会有差异;第三方商标与产品名称归各自权利人所有。使用本页信息所产生的任何后果由使用者自行承担,转载或引用请注明来源。