Mengyuan Sun

blue01223

AI & ML interests

AI Security, LLM

Recent Activity

authored a paper 7 days ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

upvoted a paper 7 days ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

authored a paper 8 days ago

InverTune: Removing Backdoors from Multimodal Contrastive Learning Models via Trigger Inversion and Activation Tuning

View all activity

Organizations

None yet

authored a paper 7 days ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published 8 days ago • 33

upvoted a paper 7 days ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published 8 days ago • 33

authored a paper 8 days ago

InverTune: Removing Backdoors from Multimodal Contrastive Learning Models via Trigger Inversion and Activation Tuning

Paper • 2506.12411 • Published Jun 14

updated a dataset 22 days ago

blue01223/math_short_CoT

Updated 22 days ago • 234

published a dataset 22 days ago

blue01223/math_short_CoT

Updated 22 days ago • 234

updated a dataset 23 days ago

blue01223/full_math

Updated 23 days ago • 238

published a dataset 23 days ago

blue01223/full_math

Updated 23 days ago • 238

liked a dataset about 1 month ago

DigitalLearningGmbH/MATH-lighteval

Viewer • Updated Jan 15 • 25k • 20.5k • 39

updated a dataset about 2 months ago

blue01223/math_splits

Viewer • Updated Jun 3 • 49.7k • 9

published a dataset about 2 months ago

blue01223/math_splits

Viewer • Updated Jun 3 • 49.7k • 9

updated a model about 2 months ago

blue01223/math_50k_splits

Updated Jun 3

published a model about 2 months ago

blue01223/math_50k_splits

Updated Jun 3

updated a dataset about 2 months ago

blue01223/hard_math_50k

Viewer • Updated Jun 2 • 49.7k • 11

published a dataset about 2 months ago

blue01223/hard_math_50k

Viewer • Updated Jun 2 • 49.7k • 11

updated a dataset about 2 months ago

blue01223/math_merge_50k

Preview • Updated Jun 2 • 6

published a dataset about 2 months ago

blue01223/math_merge_50k

Preview • Updated Jun 2 • 6

liked a dataset 2 months ago

RabotniKuma/Fast-Math-R1-SFT

Viewer • Updated 16 days ago • 7.9k • 175 • 2

liked a model 3 months ago

IAAR-Shanghai/xVerify-9B-C

9B • Updated Apr 15 • 229 • 5

upvoted a collection 3 months ago

Open-RS

Collection

Model weights & datasets in the paper "Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn’t" • 8 items • Updated Mar 21 • 12

authored a paper 3 months ago

CipherBank: Exploring the Boundary of LLM Reasoning Capabilities through Cryptography Challenges

Paper • 2504.19093 • Published Apr 27 • 17

Mengyuan Sun

AI & ML interests

Recent Activity

Organizations

blue01223's activity