Qwen
/

Qwen3-Embedding-0.6B

Feature Extraction

sentence-transformers

text-generation

sentence-similarity

text-embeddings-inference

text-generation-inference

Model card Files Files and versions

Update `README.md` to use TEI v1.7 instead

#28

by alvarobartt HF Staff - opened Jun 30

base: refs/heads/main

←

from: refs/pr/28

Discussion Files changed

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -210,13 +210,13 @@ print(scores.tolist())
 You can either run / deploy TEI on NVIDIA GPUs as:
 ```bash
-docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
 Or on CPU devices as:
 ```bash
-docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7.2 --model-id Qwen/Qwen3-Embedding-0.6B
 ```
 And then, generate the embeddings sending a HTTP POST request as:

 You can either run / deploy TEI on NVIDIA GPUs as:
 ```bash
+docker run --gpus all -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.7 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
 Or on CPU devices as:
 ```bash
+docker run -p 8080:80 -v hf_cache:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.7 --model-id Qwen/Qwen3-Embedding-0.6B --dtype float16
 ```
 And then, generate the embeddings sending a HTTP POST request as: