rl - a tianchi007 Collection

tianchi007 's Collections

rl

rl

updated Mar 11

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 114
Towards an AI co-scientist

Paper • 2502.18864 • Published Feb 26 • 52
SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published Feb 25 • 74
MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published Feb 20 • 193