MohammadRafiML
/

Qwen3-4B-Instruct-2507-Capstone-MathRL

Reinforcement Learning

Model card Files Files and versions

Qwen3-4B-Instruct-2507-Capstone-MathRL

568 MB

Ctrl+K

Ctrl+K

1 contributor

History: 11 commits

MohammadRafiML's picture

Update model card: base model + SFT + GRPO adapter details

d33f2b6 verified 2 days ago