Skip to content

Data updated 36 minutes agoSources:Text Arena

Live Benchmarks / General Chat

General chat benchmarks

Open-ended chat preference rankings from real user votes.

RankModelScore
1
1504Elo
2
1496Elo
3
1493Elo
4
1492Elo
5
1486Elo
6
1486Elo
7
GPT-5.4OpenAI
1484Elo
8
1478Elo
9
1477Elo
10
1476Elo
11
1474Elo
12
1473Elo
13
1471Elo
14
1471Elo
15
1468Elo
16
1466Elo
17
Gpt 5.4OpenAI
1466Elo
18
1463Elo
19
1462Elo
20
1461Elo
21
1460Elo
22
1459Elo
23
1456Elo
24
GLM-5Z.ai
1456Elo
25
1454Elo
26
1452Elo
27
1452Elo
28
1451Elo
29
1451Elo
30
1450Elo
31
1449Elo
32
1448Elo
33
1448Elo
34
1447Elo
35
1447Elo
36
1446Elo
37
1444Elo
38
1443Elo
39
1443Elo
40
1442Elo
41
1440Elo
42
GPT-5.2OpenAI
1439Elo
43
GPT-5.1OpenAI
1439Elo
44
1438Elo
45
1435Elo
46
1435Elo
47
1433Elo
48
1433Elo
49
1432Elo
50
1431Elo
51
1430Elo
52
1428Elo
53
1426Elo
54
1426Elo
55
1425Elo
56
1424Elo
57
1424Elo
58
1424Elo
59
1423Elo
60
1423Elo
61
1423Elo
62
1422Elo
63
1421Elo
64
1419Elo
65
1418Elo
66
1418Elo
67
1418Elo
68
1417Elo
69
1417Elo
70
1416Elo
71
1416Elo
72
1416Elo
73
1415Elo
74
1415Elo
75
1413Elo
76
1412Elo
77
1412Elo
78
1411Elo
79
1411Elo
80
1410Elo
81
1410Elo
82
1408Elo
83
1405Elo
84
1404Elo
85
1404Elo
86
1403Elo
87
1403Elo
88
1402Elo
89
1402Elo
90
1402Elo
91
1402Elo
92
1401Elo
93
1400Elo
94
1400Elo
95
1399Elo
96
Deepseek R1DeepSeek
1398Elo
97
1397Elo
98
1396Elo
99
1395Elo
100
1395Elo
101
1395Elo
102
Mai 1 PreviewMicrosoft AI
1393Elo
103
1392Elo
104
1392Elo
105
1390Elo
106
1389Elo
107
1389Elo
108
1388Elo
109
1387Elo
110
1387Elo
111
1387Elo
112
1386Elo
113
1386Elo
114
1386Elo
115
1383Elo
116
1383Elo
117
1382Elo
118
1380Elo
119
1378Elo
120
1374Elo
121
1374Elo
122
1374Elo
123
1374Elo
124
1373Elo
125
1372Elo
126
1370Elo
127
1369Elo
128
1368Elo
129
1367Elo
130
1365Elo
131
Minimax M1MiniMax
1363Elo
132
1363Elo
133
1363Elo
134
1361Elo
135
1360Elo
136
Deepseek v3DeepSeek
1358Elo
137
1357Elo
138
1357Elo
139
Intellect 3Prime Intellect
1356Elo
140
1354Elo
141
1353Elo
142
1353Elo
143
1353Elo
144
1351Elo
145
1350Elo
146
1348Elo
147
Step 3Stepfun
1348Elo
148
O3 MiniOpenAI
1347Elo
149
1347Elo
150
Qwen3 32bAlibaba
1347Elo
151
Mercury 2Inception AI
1347Elo
152
1347Elo
153
MiniMax M2MiniMax
1346Elo
154
1346Elo
155
1346Elo
156
1345Elo
157
1343Elo
158
1343Elo
159
1341Elo
160
1341Elo
161
1340Elo
162
1337Elo
163
O1 MiniOpenAI
1337Elo
164
1337Elo
165
Qwq 32bAlibaba
1336Elo
166
1335Elo
167
1334Elo
168
1334Elo
169
1334Elo
170
1334Elo
171
1332Elo
172
1331Elo
173
1328Elo
174
1327Elo
175
1327Elo
176
1327Elo
177
1327Elo
178
1326Elo
179
1323Elo
180
1323Elo
181
1323Elo
182
1323Elo
183
1322Elo
184
1321Elo
185
1321Elo
186
1321Elo
187
1320Elo
188
Glm 4 PlusZhipu AI
1319Elo
189
1318Elo
190
1318Elo
191
1318Elo
192
1317Elo
193
1317Elo
194
1317Elo
195
1315Elo
196
1314Elo
197
1313Elo
198
1312Elo
199
1312Elo
200
1311Elo
201
1309Elo
202
1308Elo
203
1307Elo
204
MercuryInception AI
1306Elo
205
1306Elo
206
1305Elo
207
1305Elo
208
1303Elo
209
1303Elo
210
1303Elo
211
1302Elo
212
1298Elo
213
1294Elo
214
1293Elo
215
1290Elo
216
1288Elo
217
1288Elo
218
1287Elo
219
1287Elo
220
1286Elo
221
1286Elo
222
1285Elo
223
1285Elo
224
1285Elo
225
1280Elo
226
1279Elo
227
1276Elo
228
1276Elo
229
1275Elo
230
1274Elo
231
1273Elo
232
Glm 4 0520Zhipu AI
1273Elo
233
1271Elo
234
1270Elo
235
1266Elo
236
1265Elo
237
1263Elo
238
1261Elo
239
1261Elo
240
1260Elo
241
1260Elo
242
1258Elo
243
Phi 4Microsoft
1255Elo
244
1251Elo
245
1249Elo
246
1241Elo
247
1240Elo
248
1238Elo
249
1237Elo
250
1234Elo
251
1233Elo
252
1233Elo
253
1232Elo
254
1232Elo
255
1228Elo
256
Command RCohere
1226Elo
257
1225Elo
258
1223Elo
259
1222Elo
260
1222Elo
261
1222Elo
262
1221Elo
263
1220Elo
264
1212Elo
265
1212Elo
266
1211Elo
267
1207Elo
268
1203Elo
269
1201Elo
270
1199Elo
271
1197Elo
272
1196Elo
273
1194Elo
274
1190Elo
275
1190Elo
276
Wizardlm 70bMicrosoft
1183Elo
277
1183Elo
278
1183Elo
279
1181Elo
280
Openchat 3.5OpenChat
1181Elo
281
1181Elo
282
1180Elo
283
1178Elo
284
1178Elo
285
Tulu 2 Dpo 70bAllenAI/UW
1177Elo
286
1174Elo
287
1172Elo
288
1170Elo
289
1170Elo
290
1170Elo
291
1166Elo
292
1166Elo
293
1164Elo
294
1156Elo
295
1155Elo
296
1154Elo
297
1151Elo
298
Dolphin 2.2.1 Mistral 7bCognitive Computations
1151Elo
299
Mpt 30b ChatMosaicML
1149Elo
300
1148Elo
301
Wizardlm 13bMicrosoft
1148Elo
302
1146Elo
303
1143Elo
304
1142Elo
305
1140Elo
306
1140Elo
307
1137Elo
308
Palm 2Google
1136Elo
309
1135Elo
310
1135Elo
311
Zephyr 7b BetaHuggingFace
1130Elo
312
1128Elo
313
1127Elo
314
1126Elo
315
Zephyr 7b AlphaHuggingFace
1126Elo
316
1120Elo
317
1118Elo
318
1114Elo
319
1113Elo
320
1113Elo
321
1110Elo
322
1108Elo
323
1107Elo
324
1091Elo
325
1089Elo
326
1073Elo
327
Koala 13bUC Berkeley
1069Elo
328
Alpaca 13bStanford
1066Elo
329
1065Elo
330
Mpt 7b ChatMosaicML
1061Elo
331
Chatglm3 6bTsinghua
1055Elo
332
1040Elo
333
Chatglm2 6bTsinghua
1023Elo
334
Oasst Pythia 12bOpenAssistant
1021Elo
335
Chatglm 6bTsinghua
994Elo
336
990Elo
337
Dolly v2 12bDatabricks
979Elo
338
971Elo
339
951Elo

Related discussion

Community pulse

r/cursorQuestion / Discussionyesterday

How I use Cursor 10+ hours a day without torching my Claude Opus 4.6 limits

Anyone else here doing full-stack Next.js in Cursor and watching the Claude quota evaporate before lunch? I used to be in the same boat — massive context windows from all the components, pages, and DB logic would smoke the default limits fa

21159u/Youssef_Wardi

Need help choosing the right AI model for your business?

Benchmarks are a starting point, not an answer. The right model depends on your workload, budget, and integration constraints — let's figure it out together.