Shi Minglei's picture

1 20 2

Shi Minglei

MingleiShi

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

upvoted a paper 5 days ago

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

upvoted a paper about 1 month ago

UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting

View all activity

Organizations

None yet

upvoted 2 papers 5 days ago

NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining

Paper • 2507.14119 • Published 10 days ago • 46

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Paper • 2507.16746 • Published 6 days ago • 29

upvoted a paper about 1 month ago

UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting

Paper • 2506.09952 • Published Jun 11 • 7

liked a dataset 2 months ago

yandex/alchemist

Viewer • Updated Jun 6 • 3.35k • 434 • 43

upvoted 3 papers 3 months ago

Flow-GRPO: Training Flow Matching Models via Online RL

Paper • 2505.05470 • Published May 8 • 80

A Survey of Interactive Generative Video

Paper • 2504.21853 • Published Apr 30 • 47

Towards Understanding Camera Motions in Any Video

Paper • 2504.15376 • Published Apr 21 • 158

upvoted 4 papers 4 months ago

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

Paper • 2503.24379 • Published Mar 31 • 77

Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published Mar 26 • 53

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 165

Position: Interactive Generative Video as Next-Generation Game Engine

Paper • 2503.17359 • Published Mar 21 • 62

commented 4 papers 4 months ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27 •

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27 •

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27 •

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27 •

authored a paper 4 months ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27

upvoted 2 papers 4 months ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 142

upvoted 2 papers 5 months ago

MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

Paper • 2503.07365 • Published Mar 10 • 62

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published Feb 13 • 44