new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Nov 28

Submitted by

zgzaacm

Video Generation Models Are Good Latent Reward Models

Tencent-Hunyuan

Tencent Hunyuan

4

Submitted by

ydalva

Canvas-to-Image: Compositional Image Generation with Multimodal Controls

·
8 authors

Submitted by

Inevitablevalor

ENACT: Evaluating Embodied Cognition with World Modeling of Egocentric Interaction

·
11 authors

Submitted by

hhua2

MIRA: Multimodal Iterative Reasoning Agent for Image Editing

·
3 authors

Submitted by

tellarin

What does it mean to understand language?

MIT

Massachusetts Institute of Technology

Submitted by

syp115

Agentic Learner with Grow-and-Refine Multimodal Semantic Memory

·
12 authors

Submitted by

txiong23

Multi-Crit: Benchmarking Multimodal Judges on Pluralistic Criteria-Following

UMCP

University of Maryland College Park