benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 16.6k β’ 73 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 214 β’ 10 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 13.9k β’ 91 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 83.4k β’ 343
benchmark lmlmcat/cmmlu Updated Jul 13, 2023 β’ 16.6k β’ 73 nlp-waseda/JMMLU Updated Feb 27, 2024 β’ 214 β’ 10 HAERAE-HUB/KMMLU Viewer β’ Updated Mar 5, 2024 β’ 244k β’ 13.9k β’ 91 openai/openai_humaneval Viewer β’ Updated Jan 4, 2024 β’ 164 β’ 83.4k β’ 343