ALMs (Audio Language Models) - a shail-2512 Collection

shail-2512 's Collections

MultiModal (Any-to-Any)

ALMs (Audio Language Models)

LLMs

TTS

Coder

Reasoning (LRMs)

Image Generation

VLMs

3D

Video Generation

Speech Recognition

Dataset to fine-tune Embeddings

Reranking Models

Embedding Models

ALMs (Audio Language Models)

updated Dec 2, 2024

Qwen/Qwen2-Audio-7B-Instruct

Audio-Text-to-Text • 8B • Updated Jan 12 • 98.4k • 465