Qian Yang's picture

4

Qian Yang

QianYangMILA

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

It Takes Two: Your GRPO Is Secretly DPO

upvoted a paper 5 months ago

REARANK: Reasoning Re-ranking Agent via Reinforcement Learning

upvoted a paper 6 months ago

Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models

View all activity

Organizations

None yet

QianYangMILA 's models 1

QianYangMILA/tmp