Sprach-Benchmarks

Chat-Präferenz-Rankings (Text Arena Elo) und Sprachverständnis (LiveBench).

Text Arena

#	Model	Score	Input $/M	Output $/M	Context	Votes
1	Claude Fable 5Anthropic	1509Elo	$10	$50	1M	4.3K
2	Claude Opus 4.6 ThinkingAnthropic	1504Elo	$5.00	$25	1M	55.1K
3	Claude Opus 4 7 ThinkingAnthropic	1502Elo	$5.00	$25	1M	41.9K
4	Claude Opus 4.6Anthropic	1499Elo	$5.00	$25	1M	58.6K
5	Claude Opus 4 7Anthropic	1494Elo	$5.00	$25	1M	43.1K
6	Muse SparkMeta	1487Elo	—	—	—	13.6K
7	Gemini 3.1 ProGoogle	1486Elo	$2.00	$12	1M	73.1K
8	Gemini 3 ProGoogle	1486Elo	$2.00	$12	1M	41.3K
9	Claude Opus 4 8 ThinkingAnthropic	1484Elo	$5.00	$25	1M	22.3K
10	Gpt 5.5 HighOpenAI	1481Elo	$5.00	$30	1M	37.3K
11	Gemini 3.5 FlashGoogle	1479Elo	$1.50	$9.00	1M	15.3K
12	GPT-5.4OpenAI	1478Elo	$2.50	$15	1M	50.4K
13	Claude Opus 4 8Anthropic	1477Elo	$5.00	$25	1M	22.7K
14	Gpt 5.2 Chat Latest 20260210OpenAI	1476Elo	$1.75	$14	128K	34.5K
15	Qwen3.7 Max PreviewAlibaba	1475Elo	$1.25	$3.75	1M	3.7K
16	Gpt 5.5OpenAI	1475Elo	$5.00	$30	1M	38.5K
17	Grok 4.20 ReasoningxAI	1475Elo	$2.00	$6.00	2M	51.7K
18	Grok 4.20xAI	1474Elo	—	—	—	26.9K
19	Gemini 3 FlashGoogle	1473Elo	$0.50	$3.00	1M	30.7K
20	Claude Opus 4.5 ThinkingAnthropic	1473Elo	$5.00	$25	200K	37.1K
21	Gpt 5.5 InstantOpenAI	1473Elo	$5.00	$30	1M	26.2K
22	Glm 5.1Z.AI	1472Elo	$1.40	$4.40	203K	22.7K
23	Claude Sonnet 4.6Anthropic	1472Elo	$3.00	$15	1M	48.7K
24	Grok 4.20 Multi Agent Beta 0309xAI	1470Elo	$2.00	$6.00	2M	50.6K
25	Claude Opus 4.5Anthropic	1469Elo	$5.00	$25	200K	71.1K
26	glm-5.2 (max)Z.AI	1469Elo	$1.40	$4.40	1M	9.3K
27	Ernie 5.1Baidu	1468Elo	—	—	—	32.7K
28	Gpt 5.4OpenAI	1467Elo	$2.50	$15	1M	53.1K
29	Mimo v2.5 ProXiaomi	1466Elo	$0.43	$0.87	1M	34.5K
30	Grok 4.1 ThinkingxAI	1466Elo	—	—	—	65.6K
31	Qwen3.5 Max PreviewAlibaba	1465Elo	—	—	—	21.5K
32	Claude Sonnet 5 HighAnthropic	1464Elo	$2.00	$10	1M	4.4K
33	Qwen3.7 PlusAlibaba	1463Elo	$0.32	$1.28	1M	14.9K
34	Kimi K2.6Moonshot AI	1461Elo	$0.95	$4.00	262K	32.7K
35	Qwen3.6 Max PreviewAlibaba	1460Elo	$1.04	$6.24	262K	5.2K
36	gemini-3-flash (thinking-minimal)Google	1460Elo	$0.50	$3.00	1M	75.6K
37	Grok 4.1xAI	1459Elo	—	—	—	67.7K
38	Deepseek v4 ProDeepSeek	1457Elo	$0.43	$0.87	1M	37.1K
39	GLM-5Z.AI	1457Elo	$1.00	$3.20	203K	27.9K
40	Deepseek v4 Pro ThinkingDeepSeek	1457Elo	$0.43	$0.87	1M	35.1K
41	Claude Sonnet 4.5 ThinkingAnthropic	1455Elo	$3.00	$15	200K	82.5K
42	Claude Sonnet 4.5Anthropic	1455Elo	$3.00	$15	200K	80.9K
43	Dola Seed 2.0 ProBytedance	1455Elo	—	—	—	59.4K
44	Gpt 5.1 HighOpenAI	1455Elo	$1.25	$10	400K	40.8K
45	Gemma 4 31bGoogle	1451Elo	$0.14	$0.40	262K	5.9K
46	Kimi K2.5 ThinkingMoonshot AI	1450Elo	$0.60	$3.00	—	55.5K
47	GPT-5.4 MiniOpenAI	1449Elo	$0.75	$4.50	400K	49.0K
48	Claude Opus 4 1 20250805 Thinking 16kAnthropic	1449Elo	$15	$75	200K	49.8K
49	Ernie 5.0 Preview 1203Baidu	1449Elo	—	—	—	9.7K
50	Gpt 5.3 Chat LatestOpenAI	1449Elo	$1.75	$14	128K	33.1K
51	MiMo V2 ProXiaomi	1448Elo	$1.00	$3.00	1M	24.6K
52	Claude Opus 4.1Anthropic	1447Elo	$15	$75	200K	77.3K
53	Ernie 5.0 0110Baidu	1447Elo	—	—	—	35.3K
54	Minimax M3MiniMax	1447Elo	$0.60	$2.40	—	19.8K
55	Gemini 2.5 ProGoogle	1446Elo	$1.25	$10	1M	124.5K
56	Gpt 4.5 Preview 2025 02 27OpenAI	1445Elo	$75	$150	128K	14.5K
57	Grok 4.3xAI	1444Elo	$1.25	$2.50	1M	37.6K
58	Qwen3.6 PlusAlibaba	1443Elo	$0.33	$1.95	1M	36.6K
59	Chatgpt 4o Latest 20250326OpenAI	1443Elo	$5.00	$15	128K	82.4K
60	Qwen 3.5 397BAlibaba	1443Elo	$0.39	$2.45	256K	50.8K
61	GLM-4.7Z.AI	1442Elo	$0.40	$1.75	203K	12.1K
62	GPT-5.1OpenAI	1439Elo	$1.25	$10	400K	43.5K
63	Gemma 4 26b A4bGoogle	1438Elo	—	—	—	5.8K
64	Gpt 5.2 HighOpenAI	1437Elo	$1.75	$14	400K	48.1K
65	Deepseek v4 Flash ThinkingDeepSeek	1437Elo	$0.25	$1.75	200K	36.7K
66	Deepseek v4 FlashDeepSeek	1436Elo	$0.09	$0.18	1M	36.8K
67	Longcat Flash Chat 2602 ExpMeituan	1436Elo	—	—	—	28.2K
68	GPT-5.2OpenAI	1435Elo	$1.75	$14	400K	68.9K
69	Qwen3 Max PreviewAlibaba	1435Elo	$0.78	$3.90	262K	27.7K
70	Gpt 5 HighOpenAI	1434Elo	$1.25	$10	400K	31.9K
71	Mimo v2.5Xiaomi	1433Elo	$0.10	$0.28	1M	35.3K
72	Gemini 3.1 Flash LiteGoogle	1433Elo	$0.25	$1.50	1M	57.8K
73	Kimi K2.5 InstantMoonshot AI	1432Elo	$0.38	$2.02	262K	8.2K
74	Grok 4.1 FastxAI	1431Elo	$0.20	$0.50	2M	56.8K
75	O3 2025 04 16OpenAI	1431Elo	$2.00	$8.00	200K	59.7K
76	Mimo v2 OmniXiaomi	1430Elo	$0.40	$2.00	262K	19.6K
77	Kimi K2 TurboMoonshot AI	1430Elo	$1.15	$8.00	262K	62.1K
78	Amazon Nova Experimental Chat 26 02 10Amazon	1427Elo	—	—	—	3.4K
79	Gpt 5 ChatOpenAI	1427Elo	$1.25	$10	128K	31.6K
80	Mistral Medium 3.5Mistral	1427Elo	$1.50	$7.50	262K	10.8K
81	GLM-4.6Z.AI	1425Elo	$0.43	$1.74	203K	35.6K
82	DeepSeek V3.2DeepSeek	1425Elo	$0.23	$0.34	131K	47.3K
83	Deepseek v3.2 Exp ThinkingDeepSeek	1425Elo	$0.27	$0.41	164K	9.1K
84	Claude Opus 4 20250514 Thinking 16kAnthropic	1424Elo	$15	$75	200K	36.9K
85	Qwen3 Max 2025 09 23Alibaba	1424Elo	$0.78	$3.90	262K	9.2K
86	Qwen3 235b A22b Instruct 2507Alibaba	1423Elo	$0.26	$1.06	—	97.2K
87	DeepSeek V3.2 ThinkingDeepSeek	1423Elo	$0.23	$0.34	131K	41.1K
88	Deepseek v3.2 ExpDeepSeek	1423Elo	$0.27	$0.41	164K	11.9K
89	Deepseek R1 0528DeepSeek	1422Elo	$0.50	$2.15	164K	18.5K
90	Grok 4 Fast ChatxAI	1421Elo	$3.00	$15	256K	6.8K
91	Nvidia Nemotron 3 Ultra 550b A55b Nvfp4NVIDIA	1420Elo	—	—	—	8.4K
92	Ernie 5.0 Preview 1022Baidu	1419Elo	—	—	—	4.7K
93	Deepseek v3.1 Terminus ThinkingDeepSeek	1418Elo	$0.27	$0.95	164K	3.5K
94	Kimi K2 0905 PreviewMoonshot AI	1418Elo	$0.60	$2.50	262K	11.8K
95	Kimi K2 0711 PreviewMoonshot AI	1417Elo	$0.60	$2.50	131K	27.6K
96	Deepseek v3.1DeepSeek	1417Elo	$1.23	$4.94	—	15.0K
97	Deepseek v3.1 ThinkingDeepSeek	1417Elo	$1.23	$4.94	—	11.7K
98	Qwen 3.5 122BAlibaba	1417Elo	$0.26	$2.08	262K	28.6K
99	MiniMax M2.7MiniMax	1417Elo	$0.18	$0.72	205K	42.4K
100	Amazon Nova Experimental Chat 26 01 10Amazon	1416Elo	—	—	—	3.4K
101	Deepseek v3.1 TerminusDeepSeek	1416Elo	$0.27	$0.95	164K	3.7K
102	Mistral Large 3Mistral	1416Elo	$0.50	$1.50	—	44.1K
103	Qwen3 Vl 235b A22b InstructAlibaba	1415Elo	$0.20	$0.88	262K	11.5K
104	Gpt 4.1 2025 04 14OpenAI	1414Elo	$2.00	$8.00	1M	51.0K
105	Hunyuan Hy3 PreviewTencent	1413Elo	$0.29	$1.17	262K	6.7K
106	Claude Opus 4 20250514Anthropic	1412Elo	$15	$75	200K	44.2K
107	Grok 3 Preview 02 24xAI	1412Elo	$3.00	$15	131K	32.9K
108	Claude Haiku 4.5Anthropic	1411Elo	$1.00	$5.00	200K	100.2K
109	Glm 4.5Z.AI	1411Elo	$0.60	$2.20	131K	24.3K
110	Gemini 2.5 FlashGoogle	1410Elo	$0.30	$2.50	1M	124.5K
111	Grok 4 0709xAI	1410Elo	$3.00	$15	256K	41.4K
112	Mistral Medium 2508Mistral	1410Elo	$0.40	$2.00	131K	93.9K
113	Qwen 3.5 27BAlibaba	1409Elo	$0.20	$1.56	262K	27.4K
114	Gemini 2.5 Flash Preview 09 2025Google	1404Elo	$0.30	$2.50	1M	32.9K
115	Grok 4 Fast ReasoningxAI	1404Elo	$0.20	$0.50	2M	18.7K
116	Gpt 5.4 Nano HighOpenAI	1403Elo	$0.20	$1.25	400K	48.0K
117	Qwen3 235b A22b No ThinkingAlibaba	1403Elo	$0.46	$1.82	131K	38.2K
118	O1 2024 12 17OpenAI	1402Elo	$15	$60	200K	27.8K
119	Qwen3 Next 80b A3b InstructAlibaba	1401Elo	$0.09	$1.10	262K	22.9K
120	Longcat Flash ChatMeituan	1401Elo	$0.20	$0.80	131K	11.4K
121	Qwen3 235b A22b Thinking 2507Alibaba	1399Elo	$0.15	$1.50	262K	9.0K
122	Claude Sonnet 4 20250514 Thinking 32kAnthropic	1399Elo	$3.00	$15	1M	35.1K
123	Deepseek R1DeepSeek	1398Elo	$0.70	$2.50	164K	18.5K
124	Qwen3.5 FlashAlibaba	1398Elo	—	—	—	48.9K
125	Qwen3 Vl 235b A22b ThinkingAlibaba	1396Elo	$0.26	$2.60	131K	7.9K
126	Qwen3.5 35b A3bAlibaba	1396Elo	$0.14	$1.00	262K	29.2K
127	Deepseek v3 0324DeepSeek	1396Elo	$3.00	$4.50	33K	45.5K
128	Hunyuan Vision 1.5 ThinkingTencent	1395Elo	—	—	—	2.2K
129	Step 3.5 FlashStepfun	1395Elo	$0.10	$0.30	262K	52.3K
130	Amazon Nova Experimental Chat 12 10Amazon	1395Elo	—	—	—	3.7K
131	mimo-v2-flash (non-thinking)Xiaomi	1393Elo	$0.10	$0.30	262K	46.7K
132	MiniMax M2.5MiniMax	1391Elo	$0.12	$0.48	205K	41.2K
133	Gpt 5 Mini HighOpenAI	1390Elo	$0.25	$2.00	400K	27.0K
134	O4 Mini 2025 04 16OpenAI	1390Elo	$1.10	$4.40	200K	45.4K
135	Claude Sonnet 4 20250514Anthropic	1389Elo	$3.00	$15	1M	40.3K
136	O1 PreviewOpenAI	1388Elo	$15	$60	—	31.1K
137	Qwen 3 CoderAlibaba	1388Elo	$0.40	$1.60	262K	25.7K
138	mimo-v2-flash (thinking)Xiaomi	1387Elo	$0.10	$0.30	262K	11.0K
139	Claude 3 7 Sonnet 20250219 Thinking 32kAnthropic	1387Elo	$3.00	$15	200K	38.8K
140	Hunyuan T1 20250711Tencent	1387Elo	—	—	—	4.7K
141	Mistral Medium 2505Mistral	1387Elo	$0.40	$2.00	131K	33.2K
142	MiniMax M2.1MiniMax	1384Elo	$0.30	$1.20	205K	17.1K
143	Qwen3 30b A3b Instruct 2507Alibaba	1383Elo	$0.05	$0.19	131K	23.7K
144	Gpt 4.1 Mini 2025 04 14OpenAI	1383Elo	$0.40	$1.60	1M	39.3K
145	Hunyuan Turbos 20250416Tencent	1382Elo	—	—	—	10.7K
146	Gemini 2.5 Flash Lite Preview 09 2025 No ThinkingGoogle	1380Elo	$0.10	$0.40	1M	47.2K
147	Trinity Large PreviewArcee AI	1379Elo	$0.15	$0.45	131K	30.1K
148	Glm 4.6vZ.AI	1377Elo	$0.30	$0.90	131K	2.8K
149	Qwen3 235b A22bAlibaba	1375Elo	$0.46	$1.82	131K	26.3K
150	Gemini 2.5 Flash Lite Preview 06 17 ThinkingGoogle	1374Elo	$0.10	$0.40	1M	32.9K
151	Qwen2.5 MaxAlibaba	1374Elo	—	—	—	32.6K
152	Glm 4.5 AirZ.AI	1373Elo	$0.13	$0.85	131K	31.1K
153	Claude 3 5 Sonnet 20241022Anthropic	1373Elo	$3.00	$15	200K	88.3K
154	Claude 3 7 Sonnet 20250219Anthropic	1371Elo	$3.00	$15	200K	43.2K
155	Qwen3 Next 80b A3b ThinkingAlibaba	1370Elo	$0.10	$0.78	262K	13.7K
156	Trinity Large ThinkingArcee AI	1369Elo	$0.25	$0.80	262K	29.2K
157	Glm 4.7 FlashZ.AI	1368Elo	$0.06	$0.40	203K	11.7K
158	Amazon Nova Experimental Chat 11 10Amazon	1367Elo	—	—	—	25.4K
159	Gemma 3 27b ItGoogle	1366Elo	$0.08	$0.16	131K	47.5K
160	Minimax M1MiniMax	1364Elo	$0.40	$2.20	1M	35.2K
161	O3 Mini HighOpenAI	1363Elo	$1.10	$4.40	200K	18.6K
162	Grok 3 Mini HighxAI	1362Elo	$0.25	$1.27	—	17.0K
163	Nvidia Nemotron 3 Super 120b A12bNVIDIA	1362Elo	—	—	—	7.5K
164	Gemini 2.0 Flash 001Google	1360Elo	$0.10	$0.40	1M	43.7K
165	Deepseek v3DeepSeek	1358Elo	$1.14	$4.56	—	21.8K
166	Mistral Small 2506Mistral	1358Elo	$0.10	$0.30	32K	17.7K
167	Grok 3 Mini BetaxAI	1357Elo	$0.30	$0.50	131K	22.7K
168	Intellect 3Prime Intellect	1356Elo	$0.20	$1.10	131K	5.3K
169	Command A 03 2025Cohere	1354Elo	$2.50	$10	256K	56.2K
170	Glm 4.5vZ.AI	1354Elo	$0.60	$1.80	66K	5.0K
171	Gemini 2.0 Flash Lite Preview 02 05Google	1353Elo	$0.07	$0.30	1M	25.0K
172	Gpt Oss 120bOpenAI	1353Elo	$0.03	$0.15	131K	30.6K
173	Gemini 1.5 Pro 002Google	1351Elo	$3.50	$11	2M	55.6K
174	Amazon Nova Experimental Chat 10 20Amazon	1350Elo	—	—	—	11.5K
175	Hunyuan Turbos 20250226Tencent	1349Elo	—	—	—	2.2K
176	Step 3Stepfun	1348Elo	$0.57	$1.42	66K	6.5K
177	Amazon Nova Experimental Chat 10 09Amazon	1348Elo	—	—	—	2.8K
178	O3 MiniOpenAI	1348Elo	$1.10	$4.40	200K	57.3K
179	Llama 3.1 Nemotron Ultra 253b v1NVIDIA	1347Elo	$0.60	$1.80	131K	2.5K
180	Qwen3 32bAlibaba	1347Elo	$0.08	$0.28	131K	3.9K
181	Mercury 2Inception AI	1347Elo	$0.25	$0.75	128K	3.1K
182	Ling Flash 2.0Ant Group	1346Elo	—	—	—	7.0K
183	Qwen Plus 0125Alibaba	1346Elo	$0.40	$1.20	131K	5.8K
184	MiniMax M2MiniMax	1346Elo	$0.26	$1.02	205K	6.9K
185	Gpt 4o 2024 05 13OpenAI	1346Elo	$5.00	$15	128K	112.9K
186	Nvidia Llama 3.3 Nemotron Super 49b v1.5NVIDIA	1343Elo	$0.10	$0.40	131K	3.3K
187	Glm 4 Plus 0111Z.AI	1343Elo	—	—	—	5.8K
188	Claude 3 5 Sonnet 20240620Anthropic	1342Elo	$3.00	$15	200K	82.4K
189	Gemma 3 12b ItGoogle	1342Elo	$0.05	$0.15	131K	3.8K
190	Hunyuan Turbo 0110Tencent	1341Elo	—	—	—	2.3K
191	Gpt 5 Nano HighOpenAI	1337Elo	$0.05	$0.40	400K	8.3K
192	O1 MiniOpenAI	1337Elo	$1.10	$4.40	—	52.0K
193	Nova 2 LiteAmazon	1337Elo	$0.30	$2.50	1M	12.2K
194	Qwq 32bAlibaba	1336Elo	$0.50	$1.00	16K	25.4K
195	Grok 2 2024 08 13xAI	1336Elo	$2.00	$10	131K	63.5K
196	Gemini Advanced 0514Google	1335Elo	—	—	—	50.1K
197	Gpt 4o 2024 08 06OpenAI	1335Elo	$2.50	$10	128K	45.5K
198	Llama 3.1 405b Instruct Bf16Meta	1335Elo	$4.00	$4.00	33K	41.4K
199	Step 2 16k Exp 202412Stepfun	1334Elo	—	—	—	4.8K
200	Llama 3.1 405b Instruct Fp8Meta	1333Elo	$4.00	$4.00	33K	59.7K
201	Olmo 3.1 32b InstructAi2	1330Elo	$0.20	$0.60	66K	12.2K
202	Molmo 2 8bAi2	1328Elo	$0.20	$0.20	37K	803
203	Yi Lightning01.AI	1328Elo	—	—	—	27.3K
204	Llama 3.3 Nemotron 49b Super v1NVIDIA	1328Elo	—	—	—	2.2K
205	Qwen3 30b A3bAlibaba	1327Elo	$0.12	$0.50	131K	26.5K
206	Llama 4 Maverick 17b 128e InstructMeta	1327Elo	$0.63	$1.80	131K	40.0K
207	Hunyuan Large 2025 02 10Tencent	1326Elo	—	—	—	3.7K
208	Gpt 4 Turbo 2024 04 09OpenAI	1324Elo	$10	$30	128K	98.1K
209	Claude 3 5 Haiku 20241022Anthropic	1324Elo	$1.00	$5.00	200K	69.9K
210	Gemini 1.5 Pro 001Google	1324Elo	$3.50	$11	2M	79.1K
211	Deepseek v2.5 1210DeepSeek	1323Elo	—	—	—	6.8K
212	Llama 4 Scout 17b 16e InstructMeta	1323Elo	$0.40	$0.70	8K	30.3K
213	Gpt 4.1 Nano 2025 04 14OpenAI	1322Elo	$0.10	$0.40	1M	6.1K
214	Claude 3 Opus 20240229Anthropic	1321Elo	$15	$75	200K	194.9K
215	Ring Flash 2.0Ant Group	1321Elo	—	—	—	7.1K
216	Step 1o Turbo 202506Stepfun	1320Elo	—	—	—	9.0K
217	Glm 4 PlusZ.AI	1319Elo	$0.44	$1.76	205K	26.1K
218	Llama 3.3 70b InstructMeta	1318Elo	$0.10	$0.32	131K	54.7K
219	Gemma 3n E4b ItGoogle	1318Elo	$0.06	$0.12	33K	22.6K
220	Qwen Max 0919Alibaba	1318Elo	$1.60	$6.40	33K	16.5K
221	Gpt 4o Mini 2024 07 18OpenAI	1318Elo	$0.15	$0.60	128K	68.7K
222	Gpt Oss 20bOpenAI	1317Elo	$0.03	$0.14	131K	10.6K
223	Nvidia Nemotron 3 Nano 30b A3b Bf16NVIDIA	1316Elo	$0.06	$0.24	262K	15.5K
224	Qwen2.5 Plus 1127Alibaba	1315Elo	—	—	—	10.2K
225	Athene v2 ChatNexusFlow	1314Elo	—	—	—	24.7K
226	Mistral Large 2407Mistral	1314Elo	$2.00	$6.00	131K	45.5K
227	Gpt 4 0125 PreviewOpenAI	1313Elo	$10	$30	128K	93.4K
228	Gpt 4 1106 PreviewOpenAI	1312Elo	$10	$30	128K	100.1K
229	Hunyuan Standard 2025 02 10Tencent	1311Elo	—	—	—	3.9K
230	Gemini 1.5 Flash 002Google	1309Elo	$0.07	$0.30	1M	34.9K
231	Grok 2 Mini 2024 08 13xAI	1308Elo	$2.00	$10	131K	52.6K
232	Deepseek v2.5DeepSeek	1307Elo	—	—	—	24.6K
233	Granite 4.1 8bIBM	1307Elo	$0.05	$0.10	131K	4.1K
234	Athene 70b 0725NexusFlow	1306Elo	—	—	—	19.6K
235	MercuryInception AI	1306Elo	$0.25	$0.75	128K	2.0K
236	Olmo 3 32b ThinkAi2	1306Elo	$0.15	$0.50	66K	5.9K
237	Mistral Large 2411Mistral	1305Elo	$2.00	$6.00	128K	28.1K
238	Magistral Medium 2506Mistral	1304Elo	$2.00	$5.00	40K	11.6K
239	Mistral Small 3.1 24b Instruct 2503Mistral	1303Elo	$0.10	$0.30	32K	33.2K
240	Gemma 3 4b ItGoogle	1303Elo	$0.05	$0.10	131K	4.2K
241	Qwen2.5 72b InstructAlibaba	1303Elo	$1.20	$1.20	—	39.4K
242	Llama 3.1 Nemotron 70b InstructNVIDIA	1299Elo	$1.20	$1.20	131K	7.1K
243	Hunyuan Large VisionTencent	1294Elo	—	—	—	5.4K
244	Llama 3.1 70b InstructMeta	1293Elo	$0.40	$0.40	131K	55.2K
245	Amazon Nova Pro v1.0Amazon	1290Elo	$0.80	$3.20	300K	24.7K
246	Jamba 1.5 LargeAI21 Labs	1289Elo	$2.00	$8.00	256K	8.7K
247	Gemma 2 27b ItGoogle	1289Elo	$0.65	$0.65	8K	75.8K
248	Reka Core 20240904Reka AI	1288Elo	—	—	—	7.3K
249	Ibm Granite H SmallIBM	1287Elo	—	—	—	5.7K
250	Gpt 4 0314OpenAI	1287Elo	$30	$60	8K	54.2K
251	Gemini 1.5 Flash 001Google	1286Elo	$0.07	$0.30	1M	62.8K
252	Llama 3.1 Tulu 3 70bAi2	1286Elo	—	—	—	2.8K
253	Llama 3.1 Nemotron 51b InstructNVIDIA	1286Elo	—	—	—	3.7K
254	Olmo 3.1 32b ThinkAi2	1285Elo	$0.15	$0.50	66K	8.5K
255	Claude 3 Sonnet 20240229Anthropic	1280Elo	$3.00	$15	200K	109.3K
256	Gemma 2 9b It SimpoPrinceton	1280Elo	$0.03	$0.09	8K	10.1K
257	Nemotron 4 340b InstructNVIDIA	1276Elo	—	—	—	19.7K
258	Llama 3 70b InstructMeta	1276Elo	$0.51	$0.74	8K	156.9K
259	Command R Plus 08 2024Cohere	1276Elo	$2.50	$10	128K	9.9K
260	Gpt 4 0613OpenAI	1275Elo	$30	$60	8K	88.7K
261	Mistral Small 24b Instruct 2501Mistral	1274Elo	$0.05	$0.08	33K	14.7K
262	Glm 4 0520Z.AI	1273Elo	—	—	—	9.8K
263	Reka Flash 20240904Reka AI	1272Elo	—	—	—	7.5K
264	Qwen2.5 Coder 32b InstructAlibaba	1270Elo	$0.87	$0.87	32K	5.4K
265	C4ai Aya Expanse 32bCohere	1267Elo	—	—	—	27.1K
266	Gemma 2 9b ItGoogle	1266Elo	$0.03	$0.09	8K	54.6K
267	Deepseek Coder v2DeepSeek	1264Elo	$0.14	$0.28	128K	15.1K
268	Qwen2 72b InstructAlibaba	1261Elo	$0.90	$0.90	33K	37.3K
269	Command R PlusCohere	1261Elo	$2.50	$10	128K	77.6K
270	Claude 3 Haiku 20240307Anthropic	1261Elo	$0.25	$1.25	200K	117.7K
271	Amazon Nova Lite v1.0Amazon	1260Elo	$0.06	$0.24	300K	19.4K
272	Gemini 1.5 Flash 8b 001Google	1259Elo	$0.07	$0.30	1M	35.6K
273	Phi 4Microsoft	1256Elo	$0.07	$0.14	16K	24.1K
274	Olmo 2 0325 32b InstructAi2	1251Elo	$0.05	$0.20	128K	3.3K
275	Command R 08 2024Cohere	1250Elo	$0.15	$0.60	128K	10.1K
276	Mistral Large 2402Mistral	1242Elo	$4.00	$12	32K	62.4K
277	Amazon Nova Micro v1.0Amazon	1241Elo	$0.04	$0.14	128K	19.4K
278	Jamba 1.5 MiniAI21 Labs	1239Elo	$0.20	$0.40	256K	8.9K
279	Ministral 8b 2410Mistral	1237Elo	$0.10	$0.10	131K	4.8K
280	Gemini Pro Dev ApiGoogle	1236Elo	$0.35	$1.05	33K	18.4K
281	Qwen1.5 110b ChatAlibaba	1233Elo	—	—	—	26.2K
282	Hunyuan Standard 256kTencent	1233Elo	—	—	—	2.7K
283	Reka Flash 21b 20240226 OnlineReka AI	1233Elo	—	—	—	15.4K
284	Qwen1.5 72b ChatAlibaba	1233Elo	—	—	—	39.3K
285	Mixtral 8x22b Instruct v0.1Mistral	1229Elo	$0.90	$0.90	66K	51.4K
286	Command RCohere	1226Elo	$0.15	$0.60	128K	54.0K
287	Reka Flash 21b 20240226Reka AI	1226Elo	—	—	—	24.8K
288	Gpt 3.5 Turbo 0125OpenAI	1224Elo	$0.50	$1.50	16K	66.2K
289	Llama 3 8b InstructMeta	1223Elo	$0.14	$0.14	8K	104.6K
290	C4ai Aya Expanse 8bCohere	1223Elo	—	—	—	9.8K
291	Gemini ProGoogle	1222Elo	$0.35	$1.05	33K	6.4K
292	Mistral MediumMistral	1222Elo	$2.70	$8.10	32K	34.5K
293	Llama 3.1 Tulu 3 8bAi2	1220Elo	—	—	—	2.9K
294	Yi 1.5 34b Chat01.AI	1212Elo	—	—	—	24.1K
295	Zephyr Orpo 141b A35b v0.1HuggingFace	1212Elo	—	—	—	4.7K
296	Llama 3.1 8b InstructMeta	1211Elo	$0.02	$0.03	131K	49.6K
297	Granite 3.1 8b InstructIBM	1208Elo	—	—	—	3.1K
298	Qwen1.5 32b ChatAlibaba	1203Elo	—	—	—	21.7K
299	Gpt 3.5 Turbo 1106OpenAI	1202Elo	$1.00	$2.00	16K	16.6K
300	Gemma 2 2b ItGoogle	1200Elo	—	—	—	46.6K
301	Phi 3 Medium 4k InstructMicrosoft	1197Elo	$0.17	$0.68	—	25.1K
302	Mixtral 8x7b Instruct v0.1Mistral	1196Elo	$0.63	$0.63	32K	73.5K
303	Dbrx Instruct PreviewDatabricks	1194Elo	$0.60	$0.60	33K	32.2K
304	Internlm2 5 20b ChatInternLM	1191Elo	$0.00	$0.00	33K	9.9K
305	Qwen1.5 14b ChatAlibaba	1190Elo	$0.30	$0.30	—	17.8K
306	Wizardlm 70bMicrosoft	1184Elo	—	—	—	8.2K
307	Deepseek Llm 67b ChatDeepSeek	1184Elo	—	—	—	4.9K
308	Yi 34b Chat01.AI	1183Elo	$0.90	$0.90	4K	15.5K
309	Granite 3.0 8b InstructIBM	1182Elo	—	—	—	6.6K
310	Openchat 3.5OpenChat	1182Elo	$0.20	$0.20	—	8.0K
311	Openchat 3.5 0106OpenChat	1182Elo	—	—	—	12.6K
312	Gemma 1.1 7b ItGoogle	1181Elo	$0.03	$0.09	8K	23.9K
313	Snowflake Arctic InstructSnowflake	1179Elo	—	—	—	32.8K
314	Granite 3.1 2b InstructIBM	1178Elo	—	—	—	3.2K
315	Tulu 2 Dpo 70bAllenAI/UW	1177Elo	—	—	—	6.5K
316	Openhermes 2.5 Mistral 7bNousResearch	1175Elo	$0.17	$0.17	—	5.0K
317	Vicuna 33bLMSYS	1172Elo	$0.00	$0.00	2K	22.5K
318	Starling Lm 7b BetaNexusFlow	1171Elo	—	—	—	16.1K
319	Phi 3 Small 8k InstructMicrosoft	1170Elo	$0.15	$0.60	—	17.8K
320	Llama 2 70b ChatMeta	1170Elo	$0.70	$2.80	4K	38.5K
321	Starling Lm 7b AlphaUC Berkeley	1167Elo	—	—	—	10.2K
322	Llama 3.2 3b InstructMeta	1166Elo	$0.05	$0.33	131K	7.9K
323	Nous Hermes 2 Mixtral 8x7b DpoNousResearch	1164Elo	$0.90	$0.90	—	3.8K
324	Granite 3.0 2b InstructIBM	1156Elo	—	—	—	6.8K
325	Qwq 32b PreviewAlibaba	1155Elo	$0.50	$1.00	16K	3.2K
326	Llama2 70b Steerlm ChatNVIDIA	1154Elo	—	—	—	3.6K
327	Solar 10.7b Instruct v1.0Upstage AI	1151Elo	$0.30	$0.30	—	4.2K
328	Dolphin 2.2.1 Mistral 7bCognitive Computations	1151Elo	$0.50	$0.50	16K	1.7K
329	Mpt 30b ChatMosaicML	1150Elo	—	—	—	2.6K
330	Mistral 7b Instruct v0.2Mistral	1149Elo	$0.20	$0.20	33K	19.4K
331	Wizardlm 13bMicrosoft	1148Elo	$0.30	$0.30	—	7.0K
332	Falcon 180b ChatTII	1147Elo	—	—	—	1.3K
333	Qwen1.5 7b ChatAlibaba	1143Elo	$0.20	$0.20	—	4.7K
334	Phi 3 Mini 4k Instruct June 2024Microsoft	1142Elo	$0.13	$0.52	4K	12.3K
335	Llama 2 13b ChatMeta	1141Elo	$0.25	$0.25	4K	19.2K
336	Vicuna 13bLMSYS	1140Elo	$0.30	$0.30	—	19.4K
337	Qwen 14b ChatAlibaba	1138Elo	—	—	—	5.0K
338	Palm 2Google	1137Elo	$0.50	$0.50	26K	8.6K
339	Gemma 7b ItGoogle	1137Elo	$0.05	$0.08	8K	8.9K
340	Codellama 34b InstructMeta	1136Elo	$0.35	$1.40	16K	7.4K
341	Zephyr 7b BetaHuggingFace	1130Elo	$0.15	$0.15	16K	11.1K
342	Phi 3 Mini 128k InstructMicrosoft	1129Elo	$0.13	$0.52	—	20.7K
343	Phi 3 Mini 4k InstructMicrosoft	1127Elo	$0.13	$0.52	—	20.1K
344	Guanaco 33bUW	1126Elo	—	—	—	2.9K
345	Zephyr 7b AlphaHuggingFace	1126Elo	—	—	—	1.8K
346	Stripedhyena Nous 7bTogether AI	1120Elo	$0.20	$0.20	—	5.2K
347	Codellama 70b InstructMeta	1118Elo	$0.70	$2.80	16K	1.1K
348	Gemma 1.1 2b ItGoogle	1115Elo	—	—	—	10.9K
349	Vicuna 7bLMSYS	1114Elo	$0.20	$0.20	—	6.9K
350	Smollm2 1.7b InstructHuggingFace	1114Elo	—	—	—	2.2K
351	Llama 3.2 1b InstructMeta	1110Elo	$0.03	$0.20	131K	8.0K
352	Mistral 7b InstructMistral	1109Elo	$0.07	$0.28	4K	9.0K
353	Llama 2 7b ChatMeta	1107Elo	$0.15	$0.15	4K	14.1K
354	Gemma 2b ItGoogle	1092Elo	$0.10	$0.10	—	4.8K
355	Qwen1.5 4b ChatAlibaba	1090Elo	$0.10	$0.10	—	7.6K
356	Olmo 7b InstructAi2	1073Elo	$0.20	$0.20	—	6.3K
357	Koala 13bUC Berkeley	1070Elo	—	—	—	7.0K
358	Alpaca 13bStanford	1068Elo	—	—	—	5.7K
359	Gpt4all 13b SnoozyNomic AI	1066Elo	—	—	—	1.7K
360	Mpt 7b ChatMosaicML	1062Elo	—	—	—	3.9K
361	Chatglm3 6bTsinghua	1055Elo	—	—	—	4.7K
362	RWKV 4 Raven 14BRWKV	1041Elo	—	—	—	4.8K
363	Chatglm2 6bTsinghua	1023Elo	—	—	—	2.7K
364	Oasst Pythia 12bOpenAssistant	1022Elo	—	—	—	6.3K
365	Chatglm 6bTsinghua	995Elo	—	—	—	4.9K
366	Fastchat T5 3bLMSYS	991Elo	—	—	—	4.2K
367	Dolly v2 12bDatabricks	980Elo	—	—	—	3.4K
368	Llama 13bMeta	973Elo	$0.23	$0.23	—	2.4K
369	Stablelm Tuned Alpha 7bStability	952Elo	—	—	—	3.3K

LiveBench Language

Originalquelle ansehen →

#	Model	Score	Input $/M	Output $/M	Context	CI
1	Claude Fable 5 Thinking xHigh Effort*losing out due to stricter content moderationAnthropic	88.5%	—	—	—	—
2	GPT-5.5 Thinking xHigh EffortOpenAI	87.7%	—	—	—	—
3	Gemini 3.1 Pro Preview HighGoogle	85.4%	—	—	—	—
4	Gemini 3 Pro Preview HighGoogle	84.6%	—	—	—	—
5	Gemini 3.5 Flash HighGoogle	84.6%	—	—	—	—
6	Gemini 3 Flash Preview HighGoogle	84.6%	—	—	—	—
7	Claude 4.6 Opus Thinking High EffortAnthropic	83.3%	—	—	—	—
8	GPT-5.4 Thinking xHigh EffortOpenAI	82.6%	—	—	—	—
9	Claude 4.8 Opus Thinking xHigh EffortAnthropic	81.4%	—	—	—	—
10	Claude 4.5 Opus Thinking High EffortAnthropic	81.3%	—	—	—	—
11	GPT-5 ProOpenAI	80.7%	—	—	—	—
12	GPT-5.3 Codex HighOpenAI	80.1%	—	—	—	—
13	GPT-5.2 HighOpenAI	79.8%	—	—	—	—
14	Qwen 3.7 MaxAlibaba	79.7%	—	—	—	—
15	GPT-5.1 HighOpenAI	79.3%	—	—	—	—
16	Claude Sonnet 5 xHigh EffortAnthropic	78.8%	—	—	—	—
17	Claude 4.5 Opus Medium EffortAnthropic	78.7%	—	—	—	—
18	DeepSeek V4 ProDeepSeek	78.1%	—	—	—	—
19	Claude 4.7 Opus Thinking xHigh EffortAnthropic	77.9%	—	—	—	—
20	Kimi K2.7 CodeMoonshot AI	77.9%	—	—	—	—
21	Grok 4.20 BetaxAI	77.7%	—	—	—	—
22	Kimi K2.5 ThinkingMoonshot AI	77.7%	—	—	—	—
23	GLM 5Z.AI	77.5%	—	—	—	—
24	Minimax M3MiniMax	76.8%	—	—	—	—
25	Claude 4.1 OpusAnthropic	76.8%	—	—	—	—
26	GPT-5.1 Codex Max HighOpenAI	76.5%	—	—	—	—
27	Claude Sonnet 4.5 ThinkingAnthropic	76.5%	—	—	—	—
28	Grok 4xAI	76.4%	—	—	—	—
29	GLM 5.2Z.AI	76.2%	—	—	—	—
30	Claude 4.6 Sonnet Thinking Medium EffortAnthropic	76.1%	—	—	—	—
31	Claude Sonnet 4.5Anthropic	76.0%	—	—	—	—
32	GPT-5 Mini HighOpenAI	75.5%	—	—	—	—
33	Gemini 2.5 Pro (Max Thinking)Google	75.5%	—	—	—	—
34	Kimi K2.6 ThinkingMoonshot AI	75.1%	—	—	—	—
35	Qwen 3.6 PlusAlibaba	75.0%	—	—	—	—
36	Grok 4.1 FastxAI	74.3%	—	—	—	—
37	GPT-5.2 CodexOpenAI	73.7%	—	—	—	—
38	Grok 4.3xAI	73.6%	—	—	—	—
39	Gemini 3.1 Flash Lite Preview HighGoogle	73.2%	—	—	—	—
40	Claude 4 Sonnet ThinkingAnthropic	72.9%	—	—	—	—
41	Claude 4.1 Opus ThinkingAnthropic	72.8%	—	—	—	—
42	Grok Build 0.1xAI	72.5%	—	—	—	—
43	GLM 5.1Z.AI	71.8%	—	—	—	—
44	GPT-5.4 Mini xHighOpenAI	71.5%	—	—	—	—
45	Gemma 4 31BGoogle	71.3%	—	—	—	—
46	DeepSeek V3.2 Exp ThinkingDeepSeek	71.1%	—	—	—	—
47	Claude 4 SonnetAnthropic	71.0%	—	—	—	—
48	DeepSeek V3.2 ThinkingDeepSeek	70.4%	—	—	—	—
49	DeepSeek V4 FlashDeepSeek	70.1%	—	—	—	—
50	GPT-5.3 InstantOpenAI	70.0%	—	—	—	—
51	Qwen 3 235B A22B Thinking 2507Alibaba	69.5%	—	—	—	—
52	GPT-5.1 CodexOpenAI	69.5%	—	—	—	—
53	MiMo V2 ProXiaomi	69.1%	—	—	—	—
54	Minimax M2.7MiniMax	66.8%	—	—	—	—
55	Kimi K2 InstructMoonshot AI	66.7%	—	—	—	—
56	Kimi K2 ThinkingMoonshot AI	66.5%	—	—	—	—
57	Claude Haiku 4.5 ThinkingAnthropic	66.5%	—	—	—	—
58	Qwen 3 Next 80B A3B InstructAlibaba	66.3%	—	—	—	—
59	Qwen 3 235B A22B Instruct 2507Alibaba	66.1%	—	—	—	—
60	DeepSeek V3.2 ExpDeepSeek	65.6%	—	—	—	—
61	Gemini 2.5 Flash (Max Thinking) (2025-09-25)Google	65.3%	—	—	—	—
62	GLM 4.7Z.AI	65.2%	—	—	—	—
63	DeepSeek V3.2DeepSeek	64.2%	—	—	—	—
64	Qwen 3.6 27BAlibaba	63.3%	—	—	—	—
65	Qwen 3.6 FlashAlibaba	63.1%	—	—	—	—
66	GPT-5.1 Codex MiniOpenAI	63.0%	—	—	—	—
67	GPT-5.4 Nano xHighOpenAI	62.5%	—	—	—	—
68	GLM 5V TurboZ.AI	62.3%	—	—	—	—
69	Gemini 2.5 Flash (Max Thinking) (2025-06-05)Google	62.3%	—	—	—	—
70	GLM 4.6Z.AI	59.0%	—	—	—	—
71	Claude Haiku 4.5Anthropic	57.0%	—	—	—	—
72	Qwen 3 Next 80B A3B ThinkingAlibaba	56.3%	—	—	—	—
73	Qwen 3 32BAlibaba	55.5%	—	—	—	—
74	Minimax M2.5MiniMax	55.1%	—	—	—	—
75	Qwen 3 30B A3BAlibaba	54.5%	—	—	—	—
76	GPT-5.1 No ThinkingOpenAI	53.8%	—	—	—	—
77	Gemini 2.5 Flash Lite (Max Thinking) (2025-09-25)Google	52.6%	—	—	—	—
78	Nemotron 3 Ultra 550B A55BNVIDIA	52.2%	—	—	—	—
79	Gemini 2.5 Flash Lite (Max Thinking) (2025-06-17)Google	52.0%	—	—	—	—
80	Grok 4.1 Fast (Non-Reasoning)xAI	50.0%	—	—	—	—
81	GPT-5.2 No ThinkingOpenAI	50.0%	—	—	—	—
82	GLM 4.6VZ.AI	49.7%	—	—	—	—
83	GPT OSS 120bOpenAI	48.6%	—	—	—	—
84	Grok Code FastxAI	48.6%	—	—	—	—
85	GPT-5 Nano HighOpenAI	46.8%	—	—	—	—
86	Devstral 2Mistral	45.7%	—	—	—	—
87	Trinity Large PreviewArcee AI	42.1%	—	—	—	—
88	Grok 4.20 Beta (Non-Reasoning)xAI	42.0%	—	—	—	—
89	Nemotron 3 Super 120B A12BNVIDIA	30.0%	—	—	—	—
90	Elephant AlphaOpenRouter	27.8%	—	—	—	—

/ Live Benchmarks

Brauchen Sie Hilfe bei der Auswahl des richtigen KI-Modells?

Benchmarks sind ein Ausgangspunkt, keine Antwort. Das richtige Modell hängt von Ihrem Workload, Budget und Ihren Integrations-Anforderungen ab – lassen Sie es uns gemeinsam herausfinden.

Kontakt aufnehmen →