orbench-llm

community

AI & ML interests

None defined yet.

spaces 2

OR-Bench Leaderboard

Evaluate over-refusal in large language models

OR-Bench Demo

Select and display model responses based on prompts

models 0

None public yet

datasets 1

orbench-llm/or-bench

Viewer • Updated Oct 1, 2024 • 82.3k • 110