Qwen
/

Qwen3-Embedding-0.6B

Feature Extraction

sentence-transformers

text-generation

sentence-similarity

text-embeddings-inference

text-generation-inference

Model card Files Files and versions

alvarobartt HF Staff commited on Jun 16

Commit

e36abad

·

verified ·

1 Parent(s): b92a382

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -210,13 +210,13 @@ print(scores.tolist())
 You can either run / deploy TEI on NVIDIA GPUs as:
 ```bash
-docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B
 ```
 Or on CPU devices as:
 ```bash
-docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
 And then, generate the embeddings sending a HTTP POST request as:

 You can either run / deploy TEI on NVIDIA GPUs as:
 ```bash
+docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
 Or on CPU devices as:
 ```bash
+docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B
 ```
 And then, generate the embeddings sending a HTTP POST request as: