General chat benchmarks

Open-ended chat preference rankings from real user votes.

Text Arena

Rank	Model	Score	Input$/M	Output$/M	Context	Votes
1	Claude Opus 4.6 ThinkingAnthropic	1504Elo	$5.00	$25	1M	16.3K
2	Claude Opus 4.6Anthropic	1496Elo	$5.00	$25	1M	17.4K
3	Muse SparkMeta	1493Elo	—	—	—	3.3K
4	Gemini 3.1 ProGoogle	1492Elo	$2.00	$12	1M	20.5K
5	Gemini 3 ProGoogle	1486Elo	$2.00	$12	1M	41.6K
6	Grok 4.20xAI	1486Elo	—	—	—	9.7K
7	GPT-5.4OpenAI	1484Elo	$2.50	$15	1M	9.7K
8	Grok 4.20 ReasoningxAI	1478Elo	$2.00	$6.00	2M	9.8K
9	Gpt 5.2 Chat Latest 20260210OpenAI	1477Elo	$1.75	$14	128K	15.7K
10	Grok 4.20 Multi Agent Beta 0309xAI	1476Elo	$2.00	$6.00	2M	10.1K
11	Gemini 3 FlashGoogle	1474Elo	$0.50	$3.00	1M	30.9K
12	Claude Opus 4.5 ThinkingAnthropic	1473Elo	$5.00	$25	200K	37.3K
13	Glm 5.1Z.ai	1471Elo	$1.26	$3.96	203K	5.3K
14	Grok 4.1 ThinkingxAI	1471Elo	—	—	—	47.5K
15	Claude Opus 4.5Anthropic	1468Elo	$5.00	$25	200K	47.3K
16	Qwen3.5 Max PreviewAlibaba	1466Elo	—	—	—	8.0K
17	Gpt 5.4OpenAI	1466Elo	$2.50	$15	1M	10.0K
18	gemini-3-flash (thinking-minimal)Google	1463Elo	$0.50	$3.00	1M	33.6K
19	Claude Sonnet 4.6Anthropic	1462Elo	$3.00	$15	1M	10.9K
20	Dola Seed 2.0 ProBytedance	1461Elo	—	—	—	18.9K
21	Grok 4.1xAI	1460Elo	—	—	—	51.5K
22	GPT-5.4 MiniOpenAI	1459Elo	$2.50	$15	1M	7.2K
23	Gpt 5.3 Chat LatestOpenAI	1456Elo	$1.75	$14	128K	14.4K
24	GLM-5Z.ai	1456Elo	$1.00	$3.20	203K	14.1K
25	Gpt 5.1 HighOpenAI	1454Elo	$1.25	$10	400K	41.0K
26	Claude Sonnet 4.5 ThinkingAnthropic	1452Elo	$3.00	$15	200K	60.4K
27	Kimi K2.5 ThinkingMoonshot	1452Elo	$0.60	$3.00	—	17.7K
28	Claude Sonnet 4.5Anthropic	1451Elo	$3.00	$15	200K	58.3K
29	Gemma 4 31bGoogle	1451Elo	$0.14	$0.40	262K	6.0K
30	Ernie 5.0 0110Baidu	1450Elo	—	—	—	22.8K
31	Ernie 5.0 Preview 1203Baidu	1449Elo	—	—	—	9.8K
32	Claude Opus 4 1 20250805 Thinking 16kAnthropic	1448Elo	$15	$75	200K	50.2K
33	Gemini 2.5 ProGoogle	1448Elo	$1.25	$10	1M	107.8K
34	Qwen 3.5 397BAlibaba	1447Elo	$0.39	$2.34	262K	15.4K
35	Claude Opus 4.1Anthropic	1447Elo	$15	$75	200K	77.9K
36	MiMo V2 ProXiaomi	1446Elo	$1.00	$3.00	1M	8.4K
37	Gpt 4.5 Preview 2025 02 27OpenAI	1444Elo	$75	$150	128K	14.5K
38	Chatgpt 4o Latest 20250326OpenAI	1443Elo	$5.00	$15	128K	83.0K
39	GLM-4.7Z.ai	1443Elo	$0.39	$1.75	203K	12.2K
40	Gpt 5.2 HighOpenAI	1442Elo	$1.75	$14	400K	30.5K
41	Longcat Flash Chat 2602 ExpMeituan	1440Elo	—	—	—	5.8K
42	GPT-5.2OpenAI	1439Elo	$1.75	$14	400K	27.6K
43	GPT-5.1OpenAI	1439Elo	$1.25	$10	400K	43.7K
44	Gemma 4 26b A4bGoogle	1438Elo	—	—	—	5.9K
45	Gemini 3.1 Flash LiteGoogle	1435Elo	$0.25	$1.50	1M	16.0K
46	Qwen3 Max PreviewAlibaba	1435Elo	$0.78	$3.90	262K	27.9K
47	Gpt 5 HighOpenAI	1433Elo	$1.25	$10	400K	32.3K
48	Kimi K2.5 InstantMoonshot	1433Elo	$0.38	$1.72	262K	8.2K
49	Grok 4.1 FastxAI	1432Elo	$0.20	$0.50	2M	42.6K
50	O3 2025 04 16OpenAI	1431Elo	$2.00	$8.00	200K	60.2K
51	Kimi K2 TurboMoonshot	1430Elo	$1.15	$8.00	262K	46.2K
52	Amazon Nova Experimental Chat 26 02 10Amazon	1428Elo	—	—	—	3.5K
53	Gpt 5 ChatOpenAI	1426Elo	$1.25	$10	128K	31.9K
54	GLM-4.6Z.ai	1426Elo	$0.39	$1.90	205K	35.9K
55	Deepseek v3.2 Exp ThinkingDeepSeek	1425Elo	$0.27	$0.41	164K	9.1K
56	Qwen3 Max 2025 09 23Alibaba	1424Elo	$0.78	$3.90	262K	9.2K
57	DeepSeek V3.2DeepSeek	1424Elo	$0.26	$0.38	164K	41.2K
58	Claude Opus 4 20250514 Thinking 16kAnthropic	1424Elo	$15	$75	200K	37.2K
59	Qwen3 235b A22b Instruct 2507Alibaba	1423Elo	$0.26	$1.06	—	82.0K
60	Deepseek v3.2 ExpDeepSeek	1423Elo	$0.27	$0.41	164K	12.0K
61	DeepSeek V3.2 ThinkingDeepSeek	1423Elo	$0.26	$0.38	164K	35.6K
62	Deepseek R1 0528DeepSeek	1422Elo	$0.45	$2.15	164K	18.6K
63	Grok 4 Fast ChatxAI	1421Elo	$3.00	$15	256K	6.9K
64	Ernie 5.0 Preview 1022Baidu	1419Elo	—	—	—	4.8K
65	Deepseek v3.1DeepSeek	1418Elo	$1.23	$4.94	—	15.1K
66	Kimi K2 0905 PreviewMoonshot	1418Elo	$0.60	$2.50	262K	11.9K
67	Qwen 3.5 122BAlibaba	1418Elo	$0.26	$2.08	262K	12.1K
68	Kimi K2 0711 PreviewMoonshot	1417Elo	$0.60	$2.50	131K	27.9K
69	Deepseek v3.1 ThinkingDeepSeek	1417Elo	$1.23	$4.94	—	11.8K
70	Deepseek v3.1 Terminus ThinkingDeepSeek	1416Elo	$0.21	$0.79	164K	3.5K
71	Deepseek v3.1 TerminusDeepSeek	1416Elo	$0.21	$0.79	164K	3.7K
72	Qwen3 Vl 235b A22b InstructAlibaba	1416Elo	$0.20	$0.88	262K	11.6K
73	Amazon Nova Experimental Chat 26 01 10Amazon	1415Elo	—	—	—	3.4K
74	Mistral Large 3Mistral	1415Elo	$0.50	$1.50	—	38.3K
75	Gpt 4.1 2025 04 14OpenAI	1413Elo	$2.00	$8.00	1M	51.4K
76	Claude Opus 4 20250514Anthropic	1412Elo	$15	$75	200K	44.6K
77	Grok 3 Preview 02 24xAI	1412Elo	$3.00	$15	131K	33.1K
78	Gemini 2.5 FlashGoogle	1411Elo	$0.30	$2.50	1M	107.2K
79	Glm 4.5Z.ai	1411Elo	$0.60	$2.20	131K	24.5K
80	Grok 4 0709xAI	1410Elo	$3.00	$15	256K	41.7K
81	Mistral Medium 2508Mistral	1410Elo	$2.70	$8.10	32K	77.3K
82	Claude Haiku 4.5Anthropic	1408Elo	$1.00	$5.00	200K	59.5K
83	Gemini 2.5 Flash Preview 09 2025Google	1405Elo	$0.30	$2.50	1M	33.1K
84	Grok 4 Fast ReasoningxAI	1404Elo	$0.20	$0.50	2M	18.9K
85	MiniMax M2.7MiniMax	1404Elo	$0.30	$1.20	205K	6.8K
86	MiniMax M2.5MiniMax	1403Elo	$0.12	$0.99	197K	17.2K
87	Qwen3 235b A22b No ThinkingAlibaba	1403Elo	$0.46	$1.82	131K	38.5K
88	Qwen 3.5 27BAlibaba	1402Elo	$0.20	$1.56	262K	11.9K
89	Gpt 5.4 Nano HighOpenAI	1402Elo	$2.50	$15	1M	6.6K
90	Qwen3 Next 80b A3b InstructAlibaba	1402Elo	$0.09	$1.10	262K	23.1K
91	O1 2024 12 17OpenAI	1402Elo	$15	$60	200K	27.8K
92	Longcat Flash ChatMeituan	1401Elo	$0.20	$0.80	131K	11.5K
93	Qwen3.5 FlashAlibaba	1400Elo	—	—	—	12.7K
94	Qwen3 235b A22b Thinking 2507Alibaba	1400Elo	$0.15	$1.50	131K	9.1K
95	Claude Sonnet 4 20250514 Thinking 32kAnthropic	1399Elo	$3.00	$15	1M	35.4K
96	Deepseek R1DeepSeek	1398Elo	$0.70	$2.50	64K	18.5K
97	Hunyuan Vision 1.5 ThinkingTencent	1397Elo	—	—	—	2.2K
98	Qwen3.5 35b A3bAlibaba	1396Elo	$0.16	$1.30	262K	12.3K
99	Qwen3 Vl 235b A22b ThinkingAlibaba	1395Elo	$0.26	$2.60	131K	8.0K
100	Amazon Nova Experimental Chat 12 10Amazon	1395Elo	—	—	—	3.7K
101	Deepseek v3 0324DeepSeek	1395Elo	$3.00	$4.50	33K	45.8K
102	Mai 1 PreviewMicrosoft AI	1393Elo	—	—	—	18.0K
103	mimo-v2-flash (non-thinking)Xiaomi	1392Elo	$0.09	$0.29	262K	30.2K
104	Step 3.5 FlashStepfun	1392Elo	$0.10	$0.30	262K	18.6K
105	O4 Mini 2025 04 16OpenAI	1390Elo	$1.10	$4.40	200K	45.7K
106	Gpt 5 Mini HighOpenAI	1389Elo	$0.25	$2.00	400K	27.3K
107	Claude Sonnet 4 20250514Anthropic	1389Elo	$3.00	$15	1M	40.7K
108	O1 PreviewOpenAI	1388Elo	$15	$60	—	31.1K
109	Qwen 3 CoderAlibaba	1387Elo	$0.40	$1.60	262K	26.0K
110	Hunyuan T1 20250711Tencent	1387Elo	—	—	—	4.7K
111	mimo-v2-flash (thinking)Xiaomi	1387Elo	$0.09	$0.29	262K	11.0K
112	Claude 3 7 Sonnet 20250219 Thinking 32kAnthropic	1386Elo	$3.00	$15	200K	39.0K
113	Mistral Medium 2505Mistral	1386Elo	$0.40	$2.00	131K	33.4K
114	MiniMax M2.1MiniMax	1386Elo	$0.29	$0.95	197K	17.2K
115	Qwen3 30b A3b Instruct 2507Alibaba	1383Elo	$0.09	$0.30	262K	23.9K
116	Hunyuan Turbos 20250416Tencent	1383Elo	—	—	—	10.8K
117	Gpt 4.1 Mini 2025 04 14OpenAI	1382Elo	$0.40	$1.60	1M	39.6K
118	Gemini 2.5 Flash Lite Preview 09 2025 No ThinkingGoogle	1380Elo	$0.10	$0.40	1M	47.5K
119	Glm 4.6vZ.ai	1378Elo	$0.30	$0.90	131K	2.8K
120	Qwen3 235b A22bAlibaba	1374Elo	$0.46	$1.82	131K	26.4K
121	Gemini 2.5 Flash Lite Preview 06 17 ThinkingGoogle	1374Elo	$0.10	$0.40	1M	33.2K
122	Trinity LargeArcee AI	1374Elo	—	—	—	13.3K
123	Qwen2.5 MaxAlibaba	1374Elo	—	—	—	32.7K
124	Glm 4.5 AirZ.ai	1373Elo	$0.13	$0.85	131K	31.4K
125	Claude 3 5 Sonnet 20241022Anthropic	1372Elo	$3.00	$15	200K	88.5K
126	Claude 3 7 Sonnet 20250219Anthropic	1370Elo	$3.00	$15	200K	43.4K
127	Qwen3 Next 80b A3b ThinkingAlibaba	1369Elo	$0.10	$0.78	131K	13.8K
128	Glm 4.7 FlashZ.ai	1368Elo	$0.06	$0.40	203K	11.8K
129	Amazon Nova Experimental Chat 11 10Amazon	1367Elo	—	—	—	25.6K
130	Gemma 3 27b ItGoogle	1365Elo	$0.08	$0.16	131K	47.9K
131	Minimax M1MiniMax	1363Elo	$0.40	$2.20	1M	35.5K
132	O3 Mini HighOpenAI	1363Elo	$1.10	$4.40	200K	18.6K
133	Grok 3 Mini HighxAI	1363Elo	$0.30	$0.50	131K	17.1K
134	Nvidia Nemotron 3 Super 120b A12bNvidia	1361Elo	—	—	—	7.4K
135	Gemini 2.0 Flash 001Google	1360Elo	$0.10	$0.40	1M	43.9K
136	Deepseek v3DeepSeek	1358Elo	$1.14	$4.56	—	21.8K
137	Grok 3 Mini BetaxAI	1357Elo	$0.30	$0.50	131K	22.9K
138	Mistral Small 2506Mistral	1357Elo	$0.10	$0.30	32K	17.8K
139	Intellect 3Prime Intellect	1356Elo	$0.20	$1.10	131K	5.4K
140	Gpt Oss 120bOpenAI	1354Elo	$0.04	$0.19	131K	30.9K
141	Command A 03 2025Cohere	1353Elo	$2.50	$10	256K	56.7K
142	Glm 4.5vZ.ai	1353Elo	$0.60	$1.80	66K	5.0K
143	Gemini 2.0 Flash Lite Preview 02 05Google	1353Elo	$0.07	$0.30	1M	25.0K
144	Gemini 1.5 Pro 002Google	1351Elo	$3.50	$11	2M	55.6K
145	Amazon Nova Experimental Chat 10 20Amazon	1350Elo	—	—	—	11.5K
146	Hunyuan Turbos 20250226Tencent	1348Elo	—	—	—	2.2K
147	Step 3Stepfun	1348Elo	$0.57	$1.42	66K	6.6K
148	O3 MiniOpenAI	1347Elo	$1.10	$4.40	200K	57.6K
149	Amazon Nova Experimental Chat 10 09Amazon	1347Elo	—	—	—	2.9K
150	Qwen3 32bAlibaba	1347Elo	$0.08	$0.24	41K	3.9K
151	Mercury 2Inception AI	1347Elo	$0.25	$0.75	128K	3.1K
152	Llama 3.1 Nemotron Ultra 253b v1Nvidia	1347Elo	$0.60	$1.80	131K	2.5K
153	MiniMax M2MiniMax	1346Elo	$0.26	$1.00	197K	6.9K
154	Ling Flash 2.0Ant Group	1346Elo	—	—	—	7.1K
155	Qwen Plus 0125Alibaba	1346Elo	$0.40	$1.20	131K	5.8K
156	Gpt 4o 2024 05 13OpenAI	1345Elo	$5.00	$15	128K	112.9K
157	Nvidia Llama 3.3 Nemotron Super 49b v1.5Nvidia	1343Elo	$0.10	$0.40	131K	3.4K
158	Glm 4 Plus 0111Zhipu	1343Elo	—	—	—	5.8K
159	Gemma 3 12b ItGoogle	1341Elo	$0.04	$0.13	131K	3.8K
160	Claude 3 5 Sonnet 20240620Anthropic	1341Elo	$3.00	$15	200K	82.4K
161	Hunyuan Turbo 0110Tencent	1340Elo	—	—	—	2.3K
162	Nova 2 LiteAmazon	1337Elo	$0.30	$2.50	1M	12.3K
163	O1 MiniOpenAI	1337Elo	$1.10	$4.40	—	52.0K
164	Gpt 5 Nano HighOpenAI	1337Elo	$0.05	$0.40	400K	8.3K
165	Qwq 32bAlibaba	1336Elo	$0.15	$0.58	131K	25.5K
166	Grok 2 2024 08 13xAI	1335Elo	$2.00	$10	131K	63.5K
167	Gpt 4o 2024 08 06OpenAI	1334Elo	$2.50	$10	128K	45.5K
168	Llama 3.1 405b Instruct Bf16Meta	1334Elo	$4.00	$4.00	33K	41.4K
169	Gemini Advanced 0514Google	1334Elo	—	—	—	50.1K
170	Step 2 16k Exp 202412Stepfun	1334Elo	—	—	—	4.8K
171	Llama 3.1 405b Instruct Fp8Meta	1332Elo	$4.00	$4.00	33K	59.7K
172	Olmo 3.1 32b InstructAi2	1331Elo	$0.20	$0.60	66K	12.3K
173	Yi Lightning01.AI	1328Elo	—	—	—	27.3K
174	Llama 3.3 Nemotron 49b Super v1Nvidia	1327Elo	—	—	—	2.2K
175	Qwen3 30b A3bAlibaba	1327Elo	$0.08	$0.28	41K	26.6K
176	Molmo 2 8bAi2	1327Elo	$0.20	$0.20	37K	806
177	Llama 4 Maverick 17b 128e InstructMeta	1327Elo	$0.63	$1.80	131K	40.2K
178	Hunyuan Large 2025 02 10Tencent	1326Elo	—	—	—	3.7K
179	Gpt 4 Turbo 2024 04 09OpenAI	1323Elo	$10	$30	128K	98.1K
180	Deepseek v2.5 1210DeepSeek	1323Elo	—	—	—	6.8K
181	Gemini 1.5 Pro 001Google	1323Elo	$3.50	$11	2M	79.1K
182	Claude 3 5 Haiku 20241022Anthropic	1323Elo	$0.80	$4.00	200K	70.2K
183	Llama 4 Scout 17b 16e InstructMeta	1322Elo	$0.40	$0.70	8K	30.5K
184	Gpt 4.1 Nano 2025 04 14OpenAI	1321Elo	$0.10	$0.40	1M	6.1K
185	Ring Flash 2.0Ant Group	1321Elo	—	—	—	7.2K
186	Claude 3 Opus 20240229Anthropic	1321Elo	$15	$75	200K	194.9K
187	Step 1o Turbo 202506Stepfun	1320Elo	—	—	—	9.1K
188	Glm 4 PlusZhipu AI	1319Elo	$0.44	$1.76	205K	26.1K
189	Gemma 3n E4b ItGoogle	1318Elo	$0.02	$0.04	33K	22.7K
190	Llama 3.3 70b InstructMeta	1318Elo	$0.10	$0.32	131K	54.9K
191	Gpt Oss 20bOpenAI	1318Elo	$0.03	$0.11	131K	10.7K
192	Nvidia Nemotron 3 Nano 30b A3b Bf16Nvidia	1317Elo	$0.06	$0.24	262K	15.6K
193	Qwen Max 0919Alibaba	1317Elo	$1.60	$6.40	33K	16.5K
194	Gpt 4o Mini 2024 07 18OpenAI	1317Elo	$0.15	$0.60	128K	68.7K
195	Qwen2.5 Plus 1127Alibaba	1315Elo	—	—	—	10.2K
196	Athene v2 ChatNexusFlow	1314Elo	—	—	—	24.7K
197	Mistral Large 2407Mistral	1313Elo	$2.00	$6.00	131K	45.5K
198	Gpt 4 0125 PreviewOpenAI	1312Elo	$10	$30	128K	93.4K
199	Gpt 4 1106 PreviewOpenAI	1312Elo	$10	$30	128K	100.1K
200	Hunyuan Standard 2025 02 10Tencent	1311Elo	—	—	—	3.9K
201	Gemini 1.5 Flash 002Google	1309Elo	$0.07	$0.30	1M	34.9K
202	Grok 2 Mini 2024 08 13xAI	1308Elo	$2.00	$10	131K	52.6K
203	Deepseek v2.5DeepSeek	1307Elo	—	—	—	24.6K
204	MercuryInception AI	1306Elo	$0.25	$0.75	128K	2.0K
205	Athene 70b 0725NexusFlow	1306Elo	—	—	—	19.6K
206	Olmo 3 32b ThinkAi2	1305Elo	$0.15	$0.50	66K	6.0K
207	Mistral Large 2411Mistral	1305Elo	$2.00	$6.00	131K	28.1K
208	Magistral Medium 2506Mistral	1303Elo	$2.00	$5.00	40K	11.7K
209	Gemma 3 4b ItGoogle	1303Elo	$0.04	$0.08	131K	4.2K
210	Mistral Small 3.1 24b Instruct 2503Mistral	1303Elo	$0.10	$0.30	32K	33.5K
211	Qwen2.5 72b InstructAlibaba	1302Elo	$1.20	$1.20	—	39.4K
212	Llama 3.1 Nemotron 70b InstructNvidia	1298Elo	$1.20	$1.20	131K	7.1K
213	Hunyuan Large VisionTencent	1294Elo	—	—	—	5.4K
214	Llama 3.1 70b InstructMeta	1293Elo	$0.40	$0.40	131K	55.2K
215	Amazon Nova Pro v1.0Amazon	1290Elo	$0.80	$3.20	300K	24.7K
216	Jamba 1.5 LargeAI21 Labs	1288Elo	$2.00	$8.00	256K	8.7K
217	Gemma 2 27b ItGoogle	1288Elo	$0.65	$0.65	8K	75.8K
218	Reka Core 20240904Reka AI	1287Elo	—	—	—	7.3K
219	Ibm Granite H SmallIBM	1287Elo	—	—	—	5.7K
220	Gpt 4 0314OpenAI	1286Elo	$30	$60	8K	54.2K
221	Llama 3.1 Tulu 3 70bAi2	1286Elo	—	—	—	2.8K
222	Olmo 3.1 32b ThinkAi2	1285Elo	$0.15	$0.50	66K	8.5K
223	Llama 3.1 Nemotron 51b InstructNvidia	1285Elo	—	—	—	3.7K
224	Gemini 1.5 Flash 001Google	1285Elo	$0.07	$0.30	1M	62.8K
225	Claude 3 Sonnet 20240229Anthropic	1280Elo	$3.00	$15	200K	109.3K
226	Gemma 2 9b It SimpoPrinceton	1279Elo	$0.03	$0.09	8K	10.1K
227	Nemotron 4 340b InstructNvidia	1276Elo	—	—	—	19.7K
228	Command R Plus 08 2024Cohere	1276Elo	$2.50	$10	128K	9.9K
229	Llama 3 70b InstructMeta	1275Elo	$0.51	$0.74	8K	156.9K
230	Gpt 4 0613OpenAI	1274Elo	$30	$60	8K	88.7K
231	Mistral Small 24b Instruct 2501Mistral	1273Elo	$0.05	$0.08	33K	14.7K
232	Glm 4 0520Zhipu AI	1273Elo	—	—	—	9.8K
233	Reka Flash 20240904Reka AI	1271Elo	—	—	—	7.5K
234	Qwen2.5 Coder 32b InstructAlibaba	1270Elo	$0.87	$0.87	32K	5.4K
235	C4ai Aya Expanse 32bCohere	1266Elo	—	—	—	27.1K
236	Gemma 2 9b ItGoogle	1265Elo	$0.03	$0.09	8K	54.6K
237	Deepseek Coder v2DeepSeek	1263Elo	$0.14	$0.28	128K	15.1K
238	Command R PlusCohere	1261Elo	$2.50	$10	128K	77.6K
239	Qwen2 72b InstructAlibaba	1261Elo	$0.90	$0.90	33K	37.3K
240	Amazon Nova Lite v1.0Amazon	1260Elo	$0.06	$0.24	300K	19.4K
241	Claude 3 Haiku 20240307Anthropic	1260Elo	$0.25	$1.25	200K	117.7K
242	Gemini 1.5 Flash 8b 001Google	1258Elo	$0.07	$0.30	1M	35.6K
243	Phi 4Microsoft	1255Elo	$0.07	$0.14	16K	24.1K
244	Olmo 2 0325 32b InstructAi2	1251Elo	$0.05	$0.20	128K	3.3K
245	Command R 08 2024Cohere	1249Elo	$0.15	$0.60	128K	10.1K
246	Mistral Large 2402Mistral	1241Elo	$4.00	$12	32K	62.4K
247	Amazon Nova Micro v1.0Amazon	1240Elo	$0.04	$0.14	128K	19.4K
248	Jamba 1.5 MiniAI21 Labs	1238Elo	$0.20	$0.40	256K	8.9K
249	Ministral 8b 2410Mistral	1237Elo	$0.10	$0.10	131K	4.8K
250	Gemini Pro Dev ApiGoogle	1234Elo	$0.35	$1.05	33K	18.4K
251	Qwen1.5 110b ChatAlibaba	1233Elo	—	—	—	26.2K
252	Hunyuan Standard 256kTencent	1233Elo	—	—	—	2.7K
253	Reka Flash 21b 20240226 OnlineReka AI	1232Elo	—	—	—	15.4K
254	Qwen1.5 72b ChatAlibaba	1232Elo	—	—	—	39.3K
255	Mixtral 8x22b Instruct v0.1Mistral	1228Elo	$0.90	$0.90	66K	51.4K
256	Command RCohere	1226Elo	$0.15	$0.60	128K	54.0K
257	Reka Flash 21b 20240226Reka AI	1225Elo	—	—	—	24.8K
258	Gpt 3.5 Turbo 0125OpenAI	1223Elo	$0.50	$1.50	16K	66.2K
259	C4ai Aya Expanse 8bCohere	1222Elo	—	—	—	9.8K
260	Llama 3 8b InstructMeta	1222Elo	$0.03	$0.04	8K	104.6K
261	Mistral MediumMistral	1222Elo	$2.70	$8.10	32K	34.5K
262	Gemini ProGoogle	1221Elo	$0.35	$1.05	33K	6.4K
263	Llama 3.1 Tulu 3 8bAi2	1220Elo	—	—	—	2.9K
264	Yi 1.5 34b Chat01.AI	1212Elo	—	—	—	24.1K
265	Zephyr Orpo 141b A35b v0.1HuggingFace	1212Elo	—	—	—	4.7K
266	Llama 3.1 8b InstructMeta	1211Elo	$0.02	$0.05	16K	49.6K
267	Granite 3.1 8b InstructIBM	1207Elo	—	—	—	3.1K
268	Qwen1.5 32b ChatAlibaba	1203Elo	—	—	—	21.7K
269	Gpt 3.5 Turbo 1106OpenAI	1201Elo	$1.00	$2.00	16K	16.6K
270	Gemma 2 2b ItGoogle	1199Elo	—	—	—	46.6K
271	Phi 3 Medium 4k InstructMicrosoft	1197Elo	$0.17	$0.68	—	25.1K
272	Mixtral 8x7b Instruct v0.1Mistral	1196Elo	$0.63	$0.63	32K	73.5K
273	Dbrx Instruct PreviewDatabricks	1194Elo	$0.60	$0.60	33K	32.2K
274	Internlm2 5 20b ChatInternLM	1190Elo	$0.00	$0.00	33K	9.9K
275	Qwen1.5 14b ChatAlibaba	1190Elo	$0.30	$0.30	—	17.8K
276	Wizardlm 70bMicrosoft	1183Elo	—	—	—	8.2K
277	Deepseek Llm 67b ChatDeepSeek	1183Elo	—	—	—	4.9K
278	Yi 34b Chat01.AI	1183Elo	$0.90	$0.90	4K	15.5K
279	Openchat 3.5 0106OpenChat	1181Elo	—	—	—	12.6K
280	Openchat 3.5OpenChat	1181Elo	$0.20	$0.20	—	8.0K
281	Granite 3.0 8b InstructIBM	1181Elo	—	—	—	6.6K
282	Gemma 1.1 7b ItGoogle	1180Elo	$0.03	$0.09	8K	23.9K
283	Snowflake Arctic InstructSnowflake	1178Elo	—	—	—	32.8K
284	Granite 3.1 2b InstructIBM	1178Elo	—	—	—	3.2K
285	Tulu 2 Dpo 70bAllenAI/UW	1177Elo	—	—	—	6.5K
286	Openhermes 2.5 Mistral 7bNousResearch	1174Elo	$0.17	$0.17	—	5.0K
287	Vicuna 33bLMSYS	1172Elo	$0.00	$0.00	2K	22.5K
288	Starling Lm 7b BetaNexusflow	1170Elo	—	—	—	16.1K
289	Phi 3 Small 8k InstructMicrosoft	1170Elo	$0.15	$0.60	—	17.8K
290	Llama 2 70b ChatMeta	1170Elo	$0.70	$2.80	4K	38.5K
291	Starling Lm 7b AlphaUC Berkeley	1166Elo	—	—	—	10.2K
292	Llama 3.2 3b InstructMeta	1166Elo	$0.05	$0.34	80K	7.9K
293	Nous Hermes 2 Mixtral 8x7b DpoNousResearch	1164Elo	$0.90	$0.90	—	3.8K
294	Qwq 32b PreviewAlibaba	1156Elo	$0.15	$0.58	131K	3.2K
295	Granite 3.0 2b InstructIBM	1155Elo	—	—	—	6.8K
296	Llama2 70b Steerlm ChatNvidia	1154Elo	—	—	—	3.6K
297	Solar 10.7b Instruct v1.0Upstage AI	1151Elo	$0.30	$0.30	—	4.2K
298	Dolphin 2.2.1 Mistral 7bCognitive Computations	1151Elo	$0.50	$0.50	16K	1.7K
299	Mpt 30b ChatMosaicML	1149Elo	—	—	—	2.6K
300	Mistral 7b Instruct v0.2Mistral	1148Elo	$0.20	$0.20	33K	19.4K
301	Wizardlm 13bMicrosoft	1148Elo	$0.30	$0.30	—	7.0K
302	Falcon 180b ChatTII	1146Elo	—	—	—	1.3K
303	Qwen1.5 7b ChatAlibaba	1143Elo	$0.20	$0.20	—	4.7K
304	Phi 3 Mini 4k Instruct June 2024Microsoft	1142Elo	$0.13	$0.52	4K	12.3K
305	Llama 2 13b ChatMeta	1140Elo	$0.25	$0.25	4K	19.2K
306	Vicuna 13bLMSYS	1140Elo	$0.30	$0.30	—	19.4K
307	Qwen 14b ChatAlibaba	1137Elo	—	—	—	5.0K
308	Palm 2Google	1136Elo	$0.50	$0.50	26K	8.6K
309	Gemma 7b ItGoogle	1135Elo	$0.05	$0.08	8K	8.9K
310	Codellama 34b InstructMeta	1135Elo	$0.35	$1.40	16K	7.4K
311	Zephyr 7b BetaHuggingFace	1130Elo	$0.15	$0.15	16K	11.1K
312	Phi 3 Mini 128k InstructMicrosoft	1128Elo	$0.13	$0.52	—	20.7K
313	Phi 3 Mini 4k InstructMicrosoft	1127Elo	$0.13	$0.52	—	20.1K
314	Guanaco 33bUW	1126Elo	—	—	—	2.9K
315	Zephyr 7b AlphaHuggingFace	1126Elo	—	—	—	1.8K
316	Stripedhyena Nous 7bTogether AI	1120Elo	$0.20	$0.20	—	5.2K
317	Codellama 70b InstructMeta	1118Elo	$0.70	$2.80	16K	1.1K
318	Gemma 1.1 2b ItGoogle	1114Elo	—	—	—	10.9K
319	Vicuna 7bLMSYS	1113Elo	$0.20	$0.20	—	6.9K
320	Smollm2 1.7b InstructHuggingFace	1113Elo	—	—	—	2.2K
321	Llama 3.2 1b InstructMeta	1110Elo	$0.03	$0.20	60K	8.0K
322	Mistral 7b InstructMistral	1108Elo	$0.07	$0.28	4K	9.0K
323	Llama 2 7b ChatMeta	1107Elo	$0.15	$0.15	4K	14.1K
324	Gemma 2b ItGoogle	1091Elo	$0.10	$0.10	—	4.8K
325	Qwen1.5 4b ChatAlibaba	1089Elo	$0.10	$0.10	—	7.6K
326	Olmo 7b InstructAi2	1073Elo	$0.20	$0.20	—	6.3K
327	Koala 13bUC Berkeley	1069Elo	—	—	—	7.0K
328	Alpaca 13bStanford	1066Elo	—	—	—	5.7K
329	Gpt4all 13b SnoozyNomic AI	1065Elo	—	—	—	1.7K
330	Mpt 7b ChatMosaicML	1061Elo	—	—	—	3.9K
331	Chatglm3 6bTsinghua	1055Elo	—	—	—	4.7K
332	RWKV 4 Raven 14BRWKV	1040Elo	—	—	—	4.8K
333	Chatglm2 6bTsinghua	1023Elo	—	—	—	2.7K
334	Oasst Pythia 12bOpenAssistant	1021Elo	—	—	—	6.3K
335	Chatglm 6bTsinghua	994Elo	—	—	—	4.9K
336	Fastchat T5 3bLMSYS	990Elo	—	—	—	4.2K
337	Dolly v2 12bDatabricks	979Elo	—	—	—	3.4K
338	Llama 13bMeta	971Elo	$0.23	$0.23	—	2.4K
339	Stablelm Tuned Alpha 7bStability	951Elo	—	—	—	3.3K

Related discussion

Community pulse

r/AnthropicPerformance 5 days ago

Opus 4.6 destroys a user’s session costing them real money

1364477u/Stochastic_berserker

r/ClaudeAI:redditgold: Workaround3 days ago

90%+ fewer tokens per session by reading a pre-compiled wiki instead of exploring files cold. Built from Karpathy's workflow.

Reduced Claude context from 47,450 tokens → 360 tokens. **“This week, Andrej Karpathy shared his ‘LLM Knowledge Bases’ setup and closed by saying, ‘I think there is room here for an incredible new product instead of a hacky collection of sc

674166u/Eastern_Exercise2637

r/OpenAINewsyesterday

OpenAI launch $100 ChatGPT plan

478193u/Gerstlauer

r/LocalLLaMAResources7 days ago

We gave 12 LLMs a startup to run for a year. GLM-5 nearly matched Claude Opus 4.6 at 11× lower cost.

33996u/DreadMutant

r/singularityAI2 days ago

So, this week claude wiped agentic AI startups with a new update. Also, as they have mythos now, they will ship things very fast without any trouble

33466u/ocean_protocol

r/cursorQuestion / Discussionyesterday

How I use Cursor 10+ hours a day without torching my Claude Opus 4.6 limits

Anyone else here doing full-stack Next.js in Cursor and watching the Claude quota evaporate before lunch? I used to be in the same boat — massive context windows from all the components, pages, and DB logic would smoke the default limits fa

21159u/Youssef_Wardi

Need help choosing the right AI model for your business?

Benchmarks are a starting point, not an answer. The right model depends on your workload, budget, and integration constraints — let's figure it out together.

Get in touch →