Qwen
/

Qwen3-30B-A3B

Text Generation

Model card Files Files and versions

Update README.md

#11

by yuchenxie - opened Apr 29

base: refs/heads/main

←

from: refs/pr/11

Discussion Files changed

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -290,7 +290,7 @@ YaRN is currently supported by several inference frameworks, e.g., `transformers
   For `vllm`, you can use
     ```shell
-    vllm serve ... --rope-scaling '{"type":"rope_type","factor":4.0,"original_max_position_embeddings":32768}' --max-model-len 131072
     ```
   For `sglang`, you can use

   For `vllm`, you can use
     ```shell
+    vllm serve ... --rope-scaling '{"rope_type":"yarn","factor":4.0,"original_max_position_embeddings":32768}' --max-model-len 131072
     ```
   For `sglang`, you can use