Longxu Dou's picture

Longxu Dou

dreamerdeo

·

https://longxudou.github.io/

AI & ML interests

Natural Language Processing

Organizations

authored 2 papers 6 months ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published Nov 5, 2025 • 132

Training Optimal Large Diffusion Language Models

Paper • 2510.03280 • Published Sep 28, 2025

authored 4 papers about 1 year ago

FlowReasoner: Reinforcing Query-Level Meta-Agents

Paper • 2504.15257 • Published Apr 21, 2025 • 47

NoisyRollout: Reinforcing Visual Reasoning with Data Augmentation

Paper • 2504.13055 • Published Apr 17, 2025 • 19

SCITAT: A Question Answering Benchmark for Scientific Tables and Text Covering Diverse Reasoning Types

Paper • 2412.11757 • Published Dec 16, 2024

Efficient Process Reward Model Training via Active Learning

Paper • 2504.10559 • Published Apr 14, 2025 • 13

authored 2 papers almost 2 years ago

Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies

Paper • 2407.13623 • Published Jul 18, 2024 • 56

RegMix: Data Mixture as Regression for Language Model Pre-training

Paper • 2407.01492 • Published Jul 1, 2024 • 41

authored 3 papers about 2 years ago

Sailor: Open Language Models for South-East Asia

Paper • 2404.03608 • Published Apr 4, 2024 • 21

From Zero to Hero: Examining the Power of Symbolic Tasks in Instruction Tuning

Paper • 2304.07995 • Published Apr 17, 2023 • 3

MultiSpider: Towards Benchmarking Multilingual Text-to-SQL Semantic Parsing

Paper • 2212.13492 • Published Dec 27, 2022 • 2