88 100 43

YSH

BestWishYsh

https://shyuanbest.github.io/

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Captain Cinema: Towards Short Movie Generation

commented on a paper 3 days ago

Captain Cinema: Towards Short Movie Generation

upvoted a paper 10 days ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

View all activity

Organizations

upvoted a paper 3 days ago

Captain Cinema: Towards Short Movie Generation

Paper • 2507.18634 • Published 3 days ago • 31

commented a paper 3 days ago

Captain Cinema: Towards Short Movie Generation

Paper • 2507.18634 • Published 3 days ago • 31 •

upvoted a paper 10 days ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published 10 days ago • 69

liked a model 11 days ago

HiDream-ai/HiDream-E1-1

Any-to-Any • Updated 11 days ago • 793 • 161

upvoted a paper 11 days ago

Lumos-1: On Autoregressive Video Generation from a Unified Model Perspective

Paper • 2507.08801 • Published 16 days ago • 29

upvoted a paper 13 days ago

SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation

Paper • 2507.09862 • Published 14 days ago • 48

updated a Space 14 days ago

ConsisID-preview

🔥

Identity-Preserving Text-to-Video Generation

updated a dataset 18 days ago

BestWishYsh/OpenS2V-5M

Updated 18 days ago • 36.2k • 13

upvoted 2 papers 19 days ago

A Survey on Latent Reasoning

Paper • 2507.06203 • Published 19 days ago • 85

Tora2: Motion and Appearance Customized Diffusion Transformer for Multi-Entity Video Generation

Paper • 2507.05963 • Published 20 days ago • 11

commented a paper 19 days ago

Tora2: Motion and Appearance Customized Diffusion Transformer for Multi-Entity Video Generation

Paper • 2507.05963 • Published 20 days ago • 11 •

upvoted 2 papers 20 days ago

VMoBA: Mixture-of-Block Attention for Video Diffusion Models

Paper • 2506.23858 • Published 28 days ago • 30

StreamDiT: Real-Time Streaming Text-to-Video Generation

Paper • 2507.03745 • Published 23 days ago • 28

upvoted an article 21 days ago

Article

Fine-tuning Llama 2 70B using PyTorch FSDP

and 3 others •

Sep 13, 2023

• 27

liked a Space 25 days ago

VLM Object Understanding

🦀

Explore object detection, visual grounding, keypoint Detecti

liked a model 25 days ago

vikhyatk/moondream2

Image-Text-to-Text • 2B • Updated 21 days ago • 588k • 1.23k

upvoted an article 28 days ago

Article

FramePack LoRA Experiment

•

Apr 19

• 22

liked 2 models about 1 month ago

black-forest-labs/FLUX.1-Kontext-dev

Image-to-Image • Updated about 1 month ago • 370k • • 1.87k

vrgamedevgirl84/Wan14BT2VFusioniX

Text-to-Video • Updated Jun 21 • 487

updated a Space about 1 month ago

OpenS2V Eval

📊

A Detailed Benchmark for Subject-to-Video Generation

YSH

AI & ML interests

Recent Activity

Organizations

BestWishYsh's activity

ConsisID-preview

Fine-tuning Llama 2 70B using PyTorch FSDP

VLM Object Understanding

FramePack LoRA Experiment

OpenS2V Eval