Yuandong Tian's picture

5 2

Yuandong Tian

tydsh

·

https://yuandong-tian.com/

AI & ML interests

Reinforcement Learning, Optimization, Representation Learning

Recent Activity

upvoted a paper 2 days ago

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

authored a paper about 2 months ago

Deep Think with Confidence

authored a paper 7 months ago

SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks

View all activity

Organizations

None yet

Papers 23

arxiv:2508.15260

arxiv:2503.15478

arxiv:2502.03275

arxiv:2501.16142

models 0

None public yet

datasets 0

None public yet