7 16 11

ZiYi Yang

AALF

https://github.com/yangzy39

yangzy39

AI & ML interests

None yet

Recent Activity

new activity 7 days ago

Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B:Is it multi lingual as usual?

new activity 7 days ago

Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B:Replication

authored a paper 14 days ago

QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

View all activity

Organizations

upvoted a paper 14 days ago

QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

Paper • 2512.12967 • Published 15 days ago • 103

upvoted a paper 3 months ago

SPELL: Self-Play Reinforcement Learning for evolving Long-Context Language Models

Paper • 2509.23863 • Published Sep 28 • 2

upvoted a paper 4 months ago

Mobile-Agent-v3: Foundamental Agents for GUI Automation

Paper • 2508.15144 • Published Aug 21 • 64

upvoted a paper 5 months ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24 • 316

upvoted 2 papers 6 months ago

Perception-Aware Policy Optimization for Multimodal Reasoning

Paper • 2507.06448 • Published Jul 8 • 47

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published Jun 26 • 51

upvoted 2 papers 7 months ago

QwenLong-L1: Towards Long-Context Large Reasoning Models with Reinforcement Learning

Paper • 2505.17667 • Published May 23 • 88

QwenLong-CPRS: Towards infty-LLMs with Dynamic Context Optimization

Paper • 2505.18092 • Published May 23 • 43

upvoted a paper 9 months ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 168

upvoted 2 papers 10 months ago

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6 • 113

FuseChat-3.0: Preference Optimization Meets Heterogeneous Model Fusion

Paper • 2503.04222 • Published Mar 6 • 15

upvoted a collection 11 months ago

FuseChat 3.0

Collection

Preference Optimization for Implicit Model Fusion • 14 items • Updated Mar 7 • 14

upvoted an article 11 months ago

Article

FuseO1-Preview: System-II Reasoning Fusion of LLMs

Jan 20

•

upvoted a paper about 1 year ago

Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12

upvoted a paper over 1 year ago

FuseChat: Knowledge Fusion of Chat Models

Paper • 2408.07990 • Published Aug 15, 2024 • 14

upvoted a paper almost 2 years ago