suzhentxt
/

Qwen2.5-Coder-0.5B-Instruct-Codeforces-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-Coder-0.5B-Instruct-Codeforces-GRPO / training_args.bin

Commit History

Model save

81cac72
verified

suzhentxt commited on Jul 22, 2025

Model save

e9d2374
verified

suzhentxt commited on Jul 22, 2025

Training in progress, step 106

7595c83
verified

suzhentxt commited on Jul 22, 2025