Instructions to use NaA-IA/Gheya-1.0-203M with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use NaA-IA/Gheya-1.0-203M with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="NaA-IA/Gheya-1.0-203M")

# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("NaA-IA/Gheya-1.0-203M")
model = AutoModelForCausalLM.from_pretrained("NaA-IA/Gheya-1.0-203M")

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use NaA-IA/Gheya-1.0-203M with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "NaA-IA/Gheya-1.0-203M"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "NaA-IA/Gheya-1.0-203M",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Use Docker

docker model run hf.co/NaA-IA/Gheya-1.0-203M

SGLang

How to use NaA-IA/Gheya-1.0-203M with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "NaA-IA/Gheya-1.0-203M" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "NaA-IA/Gheya-1.0-203M",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "NaA-IA/Gheya-1.0-203M" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "NaA-IA/Gheya-1.0-203M",
		"prompt": "Once upon a time,",
		"max_tokens": 512,
		"temperature": 0.5
	}'

Docker Model Runner
How to use NaA-IA/Gheya-1.0-203M with Docker Model Runner:
```
docker model run hf.co/NaA-IA/Gheya-1.0-203M
```
Browse Quantizations to use this model in llama.cpp, Ollama, LM Studio, or any compatible app.

🚀 Gheya-1 : La Nouvelle Génération de Fondations SLM 🚀

Bienvenue à la nouvelle ère de l'intelligence artificielle ultra-spécialisée !

✨ Vue d'Ensemble du Modèle

Gheya est le nouveau modèle de fondation de l'écosystème LES-IA-ETOILES, marquant le remplacement de l'ancienne série Small-lamina. Ce modèle est conçu pour être la base la plus robuste et la plus stable pour vos futurs affinages spécialisés.

Caractéristique	Spécification	🎯 Avantage Clé pour l'Utilisateur
Famille	Gheya	Nouvelle fondation, plus performante que la série Lamina.
Paramètres	$202$ Millions	4x plus de capacité que l'ancien standard ($51$M), assurant une meilleure stabilité linguistique.
Statut	Point de Contrôle Précoce	Version Alpha : Prête pour l'affinage, mais ne doit pas être utilisée en l'état pour l'inférence générale.
Usage Principal	Base de Fine-Tuning	Idéal pour créer vos propres SLM de niche ultra-spécialisés (comme un successeur à Nelya ou Charlotte).

🚧 État Actuel : Pourquoi les Résultats Sont Étranges

Gheya a été entraîné sur un corpus ciblé comprenant de la méta-connaissance sur l'IA, les SLM et des textes de biologie.

➡️ Conséquence : Le modèle souffre d'un sous-entraînement sévère et d'une sur-spécialisation précoce.

Ce que vous allez voir : Des générations très axées sur le vocabulaire technique (clustering, hyperparamètres, temps de convergence) même pour des prompts sans rapport (comme "Jeanne d'Arc").
Ce qu'il ne faut pas faire : Ne pas l'utiliser pour de l'inférence générale. Il ne connaît ni l'histoire, ni la culture générale. Il n'est pas encore un "SLM intelligent".

💡 Le Point Positif

Le modèle a validé l'architecture de $202$ millions. Il est stable et prêt à absorber des millions de lignes de données supplémentaires, soit par la suite de notre entraînement, soit par votre propre fine-tuning.

🛠️ Utilisation Recommandée : Le Fine-Tuning

Le véritable potentiel de Gheya réside dans sa capacité à devenir la fondation pour vos propres projets.

1. ⚙️ Continuer le Pré-entraînement (pour les Experts)

Si vous souhaitez créer un SLM généraliste français à $202$M :

Action : Alimentez-le avec des centaines de milliers de lignes de texte français diversifié et propre.
Résultat : Le modèle stabilisera sa grammaire et gagnera en généralité.

2. 🎯 Création de SLM Spécialisés (pour Tous)

Si vous souhaitez créer une IA de niche (comme le Nekolien ou un assistant technique) :

Action : Affinez (fine-tunez) Gheya sur votre petit corpus personnalisé (quelques centaines ou milliers de lignes suffisent).
Résultat : La base de $202$M devrait apprendre votre tâche plus rapidement et générer des réponses plus cohérentes et précises que l'ancienne base de $51$M.

💖 Philosophie du Modèle

Nous sommes impatients de voir les incroyables SLM de niche que vous allez créer à partir de cette nouvelle fondation !
Fait par Clemylia avec passion pour l'ingénierie et le codage.

Downloads last month: 1

Safetensors

Model size

0.2B params

Tensor type

F32

Model tree for NaA-IA/Gheya-1.0-203M

Quantizations

2 models

Datasets used to train NaA-IA/Gheya-1.0-203M

Collection including NaA-IA/Gheya-1.0-203M

SLM de Clemylia

Collection

Tout les SLM (small language model) de Clemylia • 58 items • Updated Mar 2