Sangmin Bae's picture

2 8 2

Sangmin Bae

raymin0223

·

raymin0223

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models

upvoted a paper 15 days ago

EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

upvoted a paper 16 days ago

Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation

View all activity

Organizations

None yet

upvoted 2 papers 15 days ago

Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models

Paper • 2507.07104 • Published 22 days ago • 44

EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

Paper • 2507.11407 • Published 16 days ago • 51

upvoted 2 papers 16 days ago

Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation

Paper • 2507.10524 • Published 17 days ago • 63

Flex-Judge: Think Once, Judge Anywhere

Paper • 2505.18601 • Published May 24 • 28

upvoted a paper 4 months ago

TransMamba: Flexibly Switching between Transformer and Mamba

Paper • 2503.24067 • Published Mar 31 • 21

upvoted a paper 5 months ago

DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs

Paper • 2503.07067 • Published Mar 10 • 32

upvoted a paper 9 months ago

Relaxed Recursive Transformers: Effective Parameter Sharing with Layer-wise LoRA

Paper • 2410.20672 • Published Oct 28, 2024 • 6

upvoted a paper about 1 year ago

Block Transformer: Global-to-Local Language Modeling for Fast Inference

Paper • 2406.02657 • Published Jun 4, 2024 • 42