Mtlbiohacker (Maxime cote)

liked a model 7 months ago

deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 465k • • 2.39k

liked a dataset 7 months ago

cais/hle

Viewer • Updated Sep 10 • 2.5k • 24.3k • 556

liked a Space 7 months ago

Hallucinations Leaderboard

🔥

144

View and submit LLM evaluations

liked a model 7 months ago

cais/zephyr_7b_r2d2

Text Generation • 7B • Updated Feb 26, 2024 • 3.17k • 4

liked a Space 7 months ago

Emma R1

🚀

1

MAI-DS-R1 finetuned by @mtlbiohacker

liked a model 7 months ago

Qwen/Qwen3-235B-A22B

Text Generation • 235B • Updated Jul 26 • 348k • • 1.06k

liked a dataset 7 months ago

agentica-org/DeepCoder-Preview-Dataset

Viewer • Updated Apr 9 • 25k • 1.64k • 92

liked a Space 7 months ago

Rabbits Leaderboard

💊

20

Visualize and analyze language model robustness to drug name synonyms

liked 2 datasets 7 months ago

google/bigbench

Updated Jan 18, 2024 • 258 • 63

google/IFEval

Viewer • Updated Aug 14, 2024 • 541 • 38.8k • 112

liked a model 7 months ago

Mtlbiohacker/Emma_R1

Text Generation • Updated May 14 • 1

liked a model 8 months ago

microsoft/Phi-4-reasoning-plus

Text Generation • 15B • Updated 21 days ago • 8k • 329

liked a dataset 8 months ago

spawn99/GPQA-diamond-ClaudeR1

Viewer • Updated Jan 25 • 198 • 116 • 7

liked a model 8 months ago

microsoft/MAI-DS-R1

Text Generation • 671B • Updated about 6 hours ago • 256 • 291

liked a dataset 8 months ago

nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 5.83k • 614

liked a Space 9 months ago

Leaderboard / SeaEval

🥇

9

Explore NLP leaderboard metrics

liked a model 9 months ago

aaditya/Llama3-OpenBioLLM-70B

Text Generation • Updated Jan 18 • 2.45k • 491

liked 2 Spaces 9 months ago

Open LLM Leaderboard

🏆

13.7k

Track, rank and evaluate open LLMs and chatbots

MMLU-Pro Leaderboard

🥇

237

More advanced and challenging multi-task evaluation

liked a model 9 months ago

tencent/Tencent-Hunyuan-Large

Text Generation • Updated Jan 19 • 273 • 615

Maxime cote

AI & ML interests

Organizations

deepseek-ai/DeepSeek-R1-0528

cais/hle

Hallucinations Leaderboard

cais/zephyr_7b_r2d2

Emma R1

Qwen/Qwen3-235B-A22B

agentica-org/DeepCoder-Preview-Dataset

Rabbits Leaderboard

google/bigbench

google/IFEval

Mtlbiohacker/Emma_R1

microsoft/Phi-4-reasoning-plus

spawn99/GPQA-diamond-ClaudeR1

microsoft/MAI-DS-R1

nvidia/Llama-Nemotron-Post-Training-Dataset

Leaderboard / SeaEval

aaditya/Llama3-OpenBioLLM-70B

Open LLM Leaderboard

MMLU-Pro Leaderboard

tencent/Tencent-Hunyuan-Large

Maxime cote

AI & ML interests

Organizations

Mtlbiohacker's activity

Hallucinations Leaderboard

Emma R1

Rabbits Leaderboard

Leaderboard / SeaEval

Open LLM Leaderboard

MMLU-Pro Leaderboard