bench-llm

university

AI & ML interests

None defined yet.

spaces 2

OR-Bench Leaderboard

Evaluate large language models' over-refusal behavior

OR-Bench Demo

Select and display model responses based on prompts

models 0

None public yet

datasets 2

bench-llms/or-bench-toxic-all

Viewer • Updated Dec 19, 2024 • 22.9k • 347 • 1

bench-llms/or-bench

Viewer • Updated Jun 23, 2024 • 82.3k • 473 • 1