18 44 30

Ling Yang

Lingaaaaaaa

https://yangling0818.github.io/

AI & ML interests

None yet

Recent Activity

updated a Space 2 days ago

Gen-Verse/README

updated a collection 3 days ago

ReasonFlux Series

updated a collection 3 days ago

ReasonFlux Series

View all activity

Organizations

commented a paper 21 days ago

Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published 21 days ago • 31 •

commented 2 papers about 2 months ago

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

Paper • 2509.06949 • Published Sep 8 • 56 •

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

Paper • 2509.06949 • Published Sep 8 • 56 •

commented a paper 4 months ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23 • 29 •

commented 2 papers 5 months ago

Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning

Paper • 2506.03136 • Published Jun 3 • 24 •

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22 • 6 •

commented a paper 6 months ago

MMaDA: Multimodal Large Diffusion Language Models

Paper • 2505.15809 • Published May 21 • 96 •

commented a paper 7 months ago

Training-free Diffusion Acceleration with Bottleneck Sampling

Paper • 2503.18940 • Published Mar 24 • 12 •

commented 2 papers 8 months ago

Temporal Consistency for LLM Reasoning Process Error Identification

Paper • 2503.14495 • Published Mar 18 • 11 •

WideRange4D: Enabling High-Quality 4D Reconstruction with Wide-Range Movements and Scenes

Paper • 2503.13435 • Published Mar 17 • 18 •

New activity in Gen-Verse/HermesFlow 8 months ago

Add pipeline tag and library name

#1 opened 9 months ago by

nielsr

New activity in Gen-Verse/ReasonFlux_SFT_15k 9 months ago

Improve dataset card description

#1 opened 9 months ago by

nielsr

commented 3 papers 9 months ago

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

Paper • 2502.06772 • Published Feb 10 • 22 •

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

Paper • 2502.06772 • Published Feb 10 • 22 •

ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization

Paper • 2502.04306 • Published Feb 6 • 20 •

commented 5 papers about 1 year ago

Semantic Score Distillation Sampling for Compositional Text-to-3D Generation

Paper • 2410.09009 • Published Oct 11, 2024 • 15 •

SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights

Paper • 2410.09008 • Published Oct 11, 2024 • 17 •

SuperCorrect: Supervising and Correcting Language Models with Error-Driven Insights

Paper • 2410.09008 • Published Oct 11, 2024 • 17 •

Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow

Paper • 2410.07303 • Published Oct 9, 2024 • 18 •

Trans4D: Realistic Geometry-Aware Transition for Compositional Text-to-4D Synthesis

Paper • 2410.07155 • Published Oct 9, 2024 • 11 •