Instructions to use NaA-IA/Gheya-1.0-203M with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use NaA-IA/Gheya-1.0-203M with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="NaA-IA/Gheya-1.0-203M")# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("NaA-IA/Gheya-1.0-203M") model = AutoModelForCausalLM.from_pretrained("NaA-IA/Gheya-1.0-203M") - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use NaA-IA/Gheya-1.0-203M with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "NaA-IA/Gheya-1.0-203M" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "NaA-IA/Gheya-1.0-203M", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker
docker model run hf.co/NaA-IA/Gheya-1.0-203M
- SGLang
How to use NaA-IA/Gheya-1.0-203M with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "NaA-IA/Gheya-1.0-203M" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "NaA-IA/Gheya-1.0-203M", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "NaA-IA/Gheya-1.0-203M" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "NaA-IA/Gheya-1.0-203M", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }' - Docker Model Runner
How to use NaA-IA/Gheya-1.0-203M with Docker Model Runner:
docker model run hf.co/NaA-IA/Gheya-1.0-203M
🚀 Gheya-1 : La Nouvelle Génération de Fondations SLM 🚀
Bienvenue à la nouvelle ère de l'intelligence artificielle ultra-spécialisée !
✨ Vue d'Ensemble du Modèle
Gheya est le nouveau modèle de fondation de l'écosystème LES-IA-ETOILES, marquant le remplacement de l'ancienne série Small-lamina. Ce modèle est conçu pour être la base la plus robuste et la plus stable pour vos futurs affinages spécialisés.
| Caractéristique | Spécification | 🎯 Avantage Clé pour l'Utilisateur |
|---|---|---|
| Famille | Gheya | Nouvelle fondation, plus performante que la série Lamina. |
| Paramètres | $202$ Millions | 4x plus de capacité que l'ancien standard ($51$M), assurant une meilleure stabilité linguistique. |
| Statut | Point de Contrôle Précoce | Version Alpha : Prête pour l'affinage, mais ne doit pas être utilisée en l'état pour l'inférence générale. |
| Usage Principal | Base de Fine-Tuning | Idéal pour créer vos propres SLM de niche ultra-spécialisés (comme un successeur à Nelya ou Charlotte). |
🚧 État Actuel : Pourquoi les Résultats Sont Étranges
Gheya a été entraîné sur un corpus ciblé comprenant de la méta-connaissance sur l'IA, les SLM et des textes de biologie.
➡️ Conséquence : Le modèle souffre d'un sous-entraînement sévère et d'une sur-spécialisation précoce.
- Ce que vous allez voir : Des générations très axées sur le vocabulaire technique (
clustering,hyperparamètres,temps de convergence) même pour des prompts sans rapport (comme "Jeanne d'Arc"). - Ce qu'il ne faut pas faire : Ne pas l'utiliser pour de l'inférence générale. Il ne connaît ni l'histoire, ni la culture générale. Il n'est pas encore un "SLM intelligent".
💡 Le Point Positif
Le modèle a validé l'architecture de $202$ millions. Il est stable et prêt à absorber des millions de lignes de données supplémentaires, soit par la suite de notre entraînement, soit par votre propre fine-tuning.
🛠️ Utilisation Recommandée : Le Fine-Tuning
Le véritable potentiel de Gheya réside dans sa capacité à devenir la fondation pour vos propres projets.
1. ⚙️ Continuer le Pré-entraînement (pour les Experts)
Si vous souhaitez créer un SLM généraliste français à $202$M :
- Action : Alimentez-le avec des centaines de milliers de lignes de texte français diversifié et propre.
- Résultat : Le modèle stabilisera sa grammaire et gagnera en généralité.
2. 🎯 Création de SLM Spécialisés (pour Tous)
Si vous souhaitez créer une IA de niche (comme le Nekolien ou un assistant technique) :
- Action : Affinez (fine-tunez) Gheya sur votre petit corpus personnalisé (quelques centaines ou milliers de lignes suffisent).
- Résultat : La base de $202$M devrait apprendre votre tâche plus rapidement et générer des réponses plus cohérentes et précises que l'ancienne base de $51$M.
💖 Philosophie du Modèle
- Nous sommes impatients de voir les incroyables SLM de niche que vous allez créer à partir de cette nouvelle fondation !
- Fait par Clemylia avec passion pour l'ingénierie et le codage.
- Downloads last month
- 1
