Zum Inhalt springen

Aktualisiert vor 6 StundenQuellen:Text ArenaLiveBench Language

/ Live Benchmarks / Sprache

Sprach-Benchmarks

Chat-Präferenz-Rankings (Text Arena Elo) und Sprachverständnis (LiveBench).

#ModelScore
1
1502Elo
2
1500Elo
3
1498Elo
4
1492Elo
5
1489Elo
6
1488Elo
7
1486Elo
8
1481Elo
9
1480Elo
10
GPT-5.4OpenAI
1480Elo
11
Gpt 5.5OpenAI
1478Elo
12
1478Elo
13
1477Elo
14
1475Elo
15
1475Elo
16
1474Elo
17
1473Elo
18
1473Elo
19
1473Elo
20
1472Elo
21
1472Elo
22
1468Elo
23
1468Elo
24
Gpt 5.4OpenAI
1467Elo
25
1467Elo
26
1465Elo
27
1464Elo
28
1463Elo
29
Kimi K2.6Moonshot
1462Elo
30
1461Elo
31
1460Elo
32
1459Elo
33
1457Elo
34
GLM-5Z.ai
1457Elo
35
1456Elo
36
1455Elo
37
1454Elo
38
1454Elo
39
1454Elo
40
1451Elo
41
1451Elo
42
1450Elo
43
1449Elo
44
1449Elo
45
1449Elo
46
1449Elo
47
1447Elo
48
1447Elo
49
1446Elo
50
1445Elo
51
1444Elo
52
1444Elo
53
1443Elo
54
1443Elo
55
1440Elo
56
1439Elo
57
GPT-5.1OpenAI
1439Elo
58
1438Elo
59
1436Elo
60
GPT-5.2OpenAI
1436Elo
61
1435Elo
62
1435Elo
63
1434Elo
64
1433Elo
65
1432Elo
66
1431Elo
67
1431Elo
68
1430Elo
69
Mimo v2.5Xiaomi
1429Elo
70
1427Elo
71
1427Elo
72
1426Elo
73
1425Elo
74
1424Elo
75
1424Elo
76
1424Elo
77
1423Elo
78
1423Elo
79
1422Elo
80
1422Elo
81
1421Elo
82
1419Elo
83
1418Elo
84
1418Elo
85
1418Elo
86
1417Elo
87
1417Elo
88
1417Elo
89
1417Elo
90
1416Elo
91
1416Elo
92
1415Elo
93
1415Elo
94
1413Elo
95
1412Elo
96
1412Elo
97
1411Elo
98
1411Elo
99
1410Elo
100
1410Elo
101
1410Elo
102
1409Elo
103
1409Elo
104
1406Elo
105
1405Elo
106
1404Elo
107
1403Elo
108
1402Elo
109
1402Elo
110
1401Elo
111
1399Elo
112
1399Elo
113
Deepseek R1DeepSeek
1398Elo
114
1397Elo
115
1396Elo
116
1396Elo
117
1396Elo
118
1395Elo
119
1395Elo
120
1395Elo
121
1394Elo
122
1393Elo
123
Mai 1 PreviewMicrosoft AI
1393Elo
124
1390Elo
125
1390Elo
126
1389Elo
127
1388Elo
128
1387Elo
129
1387Elo
130
1387Elo
131
1387Elo
132
1387Elo
133
1385Elo
134
1383Elo
135
1382Elo
136
1382Elo
137
1380Elo
138
1378Elo
139
1376Elo
140
1375Elo
141
1375Elo
142
1374Elo
143
1373Elo
144
1373Elo
145
1372Elo
146
1371Elo
147
1369Elo
148
1368Elo
149
1367Elo
150
1366Elo
151
Minimax M1MiniMax
1364Elo
152
1363Elo
153
1362Elo
154
1361Elo
155
1360Elo
156
Deepseek v3DeepSeek
1358Elo
157
1357Elo
158
1357Elo
159
Intellect 3Prime Intellect
1357Elo
160
1354Elo
161
1353Elo
162
1353Elo
163
1353Elo
164
1351Elo
165
1350Elo
166
1349Elo
167
Step 3Stepfun
1348Elo
168
1348Elo
169
O3 MiniOpenAI
1347Elo
170
1347Elo
171
Qwen3 32bAlibaba
1347Elo
172
Mercury 2Inception AI
1347Elo
173
1346Elo
174
MiniMax M2MiniMax
1346Elo
175
1346Elo
176
1345Elo
177
1343Elo
178
1343Elo
179
1342Elo
180
1342Elo
181
1340Elo
182
1337Elo
183
1337Elo
184
O1 MiniOpenAI
1337Elo
185
Qwq 32bAlibaba
1336Elo
186
1335Elo
187
1335Elo
188
1335Elo
189
1334Elo
190
1334Elo
191
1333Elo
192
1330Elo
193
1328Elo
194
1328Elo
195
1328Elo
196
1327Elo
197
1327Elo
198
1326Elo
199
1324Elo
200
1323Elo
201
1323Elo
202
1323Elo
203
1322Elo
204
1322Elo
205
1321Elo
206
1321Elo
207
1320Elo
208
1319Elo
209
1318Elo
210
1318Elo
211
1318Elo
212
1317Elo
213
1317Elo
214
1317Elo
215
1315Elo
216
1314Elo
217
1314Elo
218
1312Elo
219
1312Elo
220
1311Elo
221
1311Elo
222
1309Elo
223
1308Elo
224
1307Elo
225
MercuryInception AI
1306Elo
226
1306Elo
227
1305Elo
228
1305Elo
229
1304Elo
230
1303Elo
231
1303Elo
232
1303Elo
233
1299Elo
234
1294Elo
235
1293Elo
236
1290Elo
237
1289Elo
238
1288Elo
239
1287Elo
240
1287Elo
241
1286Elo
242
1286Elo
243
1286Elo
244
1285Elo
245
1285Elo
246
1280Elo
247
1279Elo
248
1276Elo
249
1276Elo
250
1275Elo
251
1274Elo
252
1274Elo
253
1273Elo
254
1271Elo
255
1270Elo
256
1267Elo
257
1266Elo
258
1264Elo
259
1261Elo
260
1261Elo
261
1260Elo
262
1260Elo
263
1258Elo
264
Phi 4Microsoft
1256Elo
265
1251Elo
266
1249Elo
267
1241Elo
268
1240Elo
269
1239Elo
270
1237Elo
271
1235Elo
272
1233Elo
273
1233Elo
274
1232Elo
275
1232Elo
276
1228Elo
277
Command RCohere
1226Elo
278
1226Elo
279
1223Elo
280
1223Elo
281
1223Elo
282
1222Elo
283
1221Elo
284
1220Elo
285
1212Elo
286
1212Elo
287
1211Elo
288
1207Elo
289
1203Elo
290
1202Elo
291
1199Elo
292
1197Elo
293
1196Elo
294
1194Elo
295
1190Elo
296
1190Elo
297
Wizardlm 70bMicrosoft
1184Elo
298
1183Elo
299
1183Elo
300
1181Elo
301
Openchat 3.5OpenChat
1181Elo
302
1181Elo
303
1180Elo
304
1178Elo
305
1178Elo
306
Tulu 2 Dpo 70bAllenAI/UW
1177Elo
307
1174Elo
308
1172Elo
309
1171Elo
310
1170Elo
311
1170Elo
312
1166Elo
313
1166Elo
314
1164Elo
315
1155Elo
316
1155Elo
317
1154Elo
318
1151Elo
319
Dolphin 2.2.1 Mistral 7bCognitive Computations
1151Elo
320
Mpt 30b ChatMosaicML
1149Elo
321
1148Elo
322
Wizardlm 13bMicrosoft
1148Elo
323
1146Elo
324
1143Elo
325
1142Elo
326
1140Elo
327
1140Elo
328
1137Elo
329
Palm 2Google
1137Elo
330
1136Elo
331
1135Elo
332
Zephyr 7b BetaHuggingFace
1130Elo
333
1128Elo
334
1127Elo
335
1126Elo
336
Zephyr 7b AlphaHuggingFace
1126Elo
337
1120Elo
338
1118Elo
339
1114Elo
340
1114Elo
341
1113Elo
342
1110Elo
343
1109Elo
344
1107Elo
345
1092Elo
346
1089Elo
347
1073Elo
348
Koala 13bUC Berkeley
1069Elo
349
Alpaca 13bStanford
1067Elo
350
1065Elo
351
Mpt 7b ChatMosaicML
1061Elo
352
Chatglm3 6bTsinghua
1055Elo
353
1040Elo
354
Chatglm2 6bTsinghua
1023Elo
355
Oasst Pythia 12bOpenAssistant
1021Elo
356
Chatglm 6bTsinghua
994Elo
357
990Elo
358
Dolly v2 12bDatabricks
979Elo
359
972Elo
360
952Elo

/ Live Benchmarks

Brauchen Sie Hilfe bei der Auswahl des richtigen KI-Modells?

Benchmarks sind ein Ausgangspunkt, keine Antwort. Das richtige Modell hängt von Ihrem Workload, Budget und Ihren Integrations-Anforderungen ab – lassen Sie es uns gemeinsam herausfinden.