Sun Donghae's picture

Sun Donghae

NLPBada

·

https://blog.naver.com/gypsi12

DonghaeSuh

AI & ML interests

NLP

Recent Activity

upvoted a paper about 2 months ago

Open Data Synthesis For Deep Research

upvoted a paper about 2 months ago

Why Language Models Hallucinate

upvoted a paper about 2 months ago

Reverse-Engineered Reasoning for Open-Ended Generation

View all activity

Organizations

None yet

upvoted 5 papers about 2 months ago

Open Data Synthesis For Deep Research

Paper • 2509.00375 • Published Aug 30 • 68

Why Language Models Hallucinate

Paper • 2509.04664 • Published Sep 4 • 189

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7 • 147

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

Paper • 2509.07980 • Published Sep 9 • 98

Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth

Paper • 2509.03867 • Published Sep 4 • 208

upvoted a paper 2 months ago

Intern-S1: A Scientific Multimodal Foundation Model

Paper • 2508.15763 • Published Aug 21 • 254

upvoted 3 papers 3 months ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published Jul 23 • 36

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17 • 257

Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs

Paper • 2507.09477 • Published Jul 13 • 84

upvoted 7 papers 4 months ago

MIRIX: Multi-Agent Memory System for LLM-Based Agents

Paper • 2507.07957 • Published Jul 10 • 73

A Survey on Latent Reasoning

Paper • 2507.06203 • Published Jul 8 • 92

SingLoRA: Low Rank Adaptation Using a Single Matrix

Paper • 2507.05566 • Published Jul 8 • 112

Scaling RL to Long Videos

Paper • 2507.07966 • Published Jul 10 • 157

MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published Jul 4 • 153

WebSailor: Navigating Super-human Reasoning for Web Agent

Paper • 2507.02592 • Published Jul 3 • 121

AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models

Paper • 2506.19851 • Published Jun 24 • 60

liked 2 models 4 months ago

MiniMaxAI/MiniMax-M1-80k

Text Generation • 456B • Updated Jul 7 • 216 • • 674

nanonets/Nanonets-OCR-s

Image-Text-to-Text • 4B • Updated Jun 20 • 143k • 1.55k

upvoted 2 papers 4 months ago

Scaling Test-time Compute for LLM Agents

Paper • 2506.12928 • Published Jun 15 • 63

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

Paper • 2506.13585 • Published Jun 16 • 267