lioushz

Shz

AI & ML interests

None yet

Recent Activity

published a dataset 15 days ago

opencompass/ATLAS

updated a dataset 15 days ago

opencompass/ATLAS

upvoted a paper 16 days ago

ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning

View all activity

Organizations

published a dataset 15 days ago

opencompass/ATLAS

Viewer • Updated 15 days ago • 798 • 50

updated a dataset 15 days ago

opencompass/ATLAS

Viewer • Updated 15 days ago • 798 • 50

upvoted a paper 16 days ago

ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning

Paper • 2511.14366 • Published 17 days ago • 14

upvoted a paper 4 months ago

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward

Paper • 2508.03686 • Published Aug 5 • 37

upvoted a paper 5 months ago

CompassJudger-2: Towards Generalist Judge Model via Verifiable Rewards

Paper • 2507.09104 • Published Jul 12 • 17

liked 3 models 5 months ago

published a dataset 5 months ago

opencompass/VerifierBench

Viewer • Updated Aug 26 • 2.82k • 75 • 3

updated a model 5 months ago

opencompass/CompassVerifier-32B

33B • Updated 9 days ago • 25 • 7

published a model 5 months ago

opencompass/CompassVerifier-7B

8B • Updated 9 days ago • 555 • 4

updated a model 5 months ago

opencompass/CompassVerifier-7B

8B • Updated 9 days ago • 555 • 4

published a model 5 months ago

opencompass/CompassVerifier-3B

3B • Updated 9 days ago • 354 • 5

updated a model 5 months ago

opencompass/CompassVerifier-3B

3B • Updated 9 days ago • 354 • 5

updated a dataset 5 months ago

opencompass/VerifierBench

Viewer • Updated Aug 26 • 2.82k • 75 • 3

upvoted a paper 5 months ago

Rethinking Verification for LLM Code Generation: From Generation to Testing

Paper • 2507.06920 • Published Jul 9 • 28

published a model 5 months ago

opencompass/CompassVerifier-32B

33B • Updated 9 days ago • 25 • 7

updated a collection 5 months ago

CompassVerifier

Collection

CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward • 5 items • Updated Aug 31 • 7

lioushz

AI & ML interests

Recent Activity

Organizations

Shz's activity