Metrics:

Model	CER	WER
SALT-asr	8.42	18.49

Method: Extends a pre-trained LLM with audio tokens and fine-tunes on ASR task.
Audio tokenization: SpeechTokenizer (semantic tokens only).

Safetensors

Model size

495M params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Vikhrmodels/salt-qwen2.5-0.5b-asr

Base model

Finetuned

(359)

this model

Datasets used to train Vikhrmodels/salt-qwen2.5-0.5b-asr