ZhenghaiXue
/

Qwen2.5-7B-SimpleTIR

Reinforcement Learning

Model card Files Files and versions

ZhenghaiXue commited on Jul 8

Commit

fbe635a

·

verified ·

1 Parent(s): 7528608

Create README.md

Files changed (1) hide show

README.md +13 -0

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+license: apache-2.0
+datasets:
+- hkust-nlp/SimpleRL-Zoo-Data
+- agentica-org/DeepScaleR-Preview-Dataset
+language:
+- en
+metrics:
+- accuracy
+base_model:
+- Qwen/Qwen2.5-7B
+pipeline_tag: reinforcement-learning
+---