Llama 3.2 Instruct 11B (Vision)

llama-3-2-instruct-11b-vision · 33 samples · combined / raw

Score over time

Cost over time

Run?	Fetched?	Score?	Quality?	Cost?	Intel?	Code?	Agent?	MMMU%?
#43	2026-05-13 17:00:49	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#42	2026-05-13 16:00:49	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#41	2026-05-13 15:00:49	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#35	2026-05-13 09:00:49	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#34	2026-05-13 08:00:49	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#33	2026-05-13 07:00:20	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#32	2026-05-13 06:00:23	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#31	2026-05-13 05:00:25	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#30	2026-05-13 04:00:30	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#29	2026-05-13 03:00:35	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#28	2026-05-13 02:00:24	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#27	2026-05-13 01:00:29	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#26	2026-05-13 00:00:26	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#25	2026-05-12 23:00:22	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#24	2026-05-12 22:00:27	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#23	2026-05-12 21:00:26	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#22	2026-05-12 20:00:23	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#21	2026-05-12 19:00:24	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#20	2026-05-12 18:00:35	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#19	2026-05-12 17:00:36	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#18	2026-05-12 16:00:32	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#16	2026-05-12 14:00:12	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#15	2026-05-12 13:00:16	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#12	2026-05-12 10:00:12	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#11	2026-05-12 09:00:15	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#9	2026-05-12 07:00:22	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#8	2026-05-12 06:00:21	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#7	2026-05-12 05:00:17	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#5	2026-05-12 03:00:11	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#4	2026-05-12 02:00:11	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#3	2026-05-12 01:00:09	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#2	2026-05-12 00:00:09	6.0	6.0	$19.4	8.7	4.3	4.9	29.3
#1	2026-05-11 23:17:33	6.0	6.0	$19.4	8.7	4.3	4.9	29.3