Instructions to use Conlanger-LLM-CLEM/micro-nelya-instruct-v0 with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Conlanger-LLM-CLEM/micro-nelya-instruct-v0 with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="Conlanger-LLM-CLEM/micro-nelya-instruct-v0") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("Conlanger-LLM-CLEM/micro-nelya-instruct-v0") model = AutoModelForCausalLM.from_pretrained("Conlanger-LLM-CLEM/micro-nelya-instruct-v0") messages = [ {"role": "user", "content": "Who are you?"}, ] inputs = tokenizer.apply_chat_template( messages, add_generation_prompt=True, tokenize=True, return_dict=True, return_tensors="pt", ).to(model.device) outputs = model.generate(**inputs, max_new_tokens=40) print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:])) - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use Conlanger-LLM-CLEM/micro-nelya-instruct-v0 with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "Conlanger-LLM-CLEM/micro-nelya-instruct-v0" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Conlanger-LLM-CLEM/micro-nelya-instruct-v0", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/Conlanger-LLM-CLEM/micro-nelya-instruct-v0
- SGLang
How to use Conlanger-LLM-CLEM/micro-nelya-instruct-v0 with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "Conlanger-LLM-CLEM/micro-nelya-instruct-v0" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Conlanger-LLM-CLEM/micro-nelya-instruct-v0", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "Conlanger-LLM-CLEM/micro-nelya-instruct-v0" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Conlanger-LLM-CLEM/micro-nelya-instruct-v0", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use Conlanger-LLM-CLEM/micro-nelya-instruct-v0 with Docker Model Runner:
docker model run hf.co/Conlanger-LLM-CLEM/micro-nelya-instruct-v0
You need to agree to share your contact information to access this model
This repository is publicly accessible, but you have to accept the conditions to access its files and content.
✨🩷 Pour accéder a micro-nelya-instruct-v0, vous devez accepter nos conditions et notre license. Ainsi que utiliser le modèle ce pour quoi il a été entraîné. ✨🩷 Merci de remplir le formulaire ici-présent pour faire votre candidature.
Log in or Sign Up to review the conditions and access this model content.
🐾 Fiche Technique : micro-nelya-instruct-v0 🐾
✨ Présentation
micro-nelya-instruct-v0 est la première version optimisée pour le suivi d'instructions de la lignée Nelya-neko. Basé sur l'architecture ultra-légère de 191k paramètres, ce modèle a été spécifiquement entraîné (SFT) pour interagir de manière cohérente en Nekolien, la langue construite (conlang) développée par Clem. Malgré sa taille microscopique, il conserve une fenêtre de contexte impressionnante et une identité native forte.
📊 Spécifications Techniques
- Modèle de base : micro-nelya-neko
- Paramètres : 191 000 (191k)
- Version : v0 (Initial Instruct)
- Fenêtre de contexte : 7 000 tokens
- Langue native : Nekolien (Nekodia)
- Capacité : Suivi d'instructions et de questions simples
🛠️ Chat Template & Protocole
Le modèle utilise un template de dialogue exclusif ("Clem-Style"). Il est impératif d'utiliser ces balises pour garantir la stabilité de la réponse et éviter les hallucinations.
Structure du Template (Jinja2) :
{%- for message in messages -%}
{%- if message.role == 'user' -%}
{{ '+usia:\n' + message.content + '\n\n' }}
{%- elif message.role == 'assistant' -%}
{{ '-nekodia:\n' + message.content + ' <|end|>\n' }}
{%- endif -%}
{%- endfor -%}
{%- if add_generation_prompt -%}
{{ '-nekodia:\n' }}
{%- endif -%}
Format d'entrée brut (Raw Prompt) :
+usia:
[Votre message ici en Nekolien ou Français]
-nekodia:
[Réponse du modèle] <|end|>
🚀 Points Forts
- Légèreté Absolue : Peut être déployé sur pratiquement n'importe quel support (navigateur, mobile, micro-contrôleur).
- Latence Zéro : Réponse quasi-instantanée grâce au faible nombre de paramètres.
- Identité Gravée : Le modèle "sait" qu'il est une entité Nekodia dès le premier token sans besoin de prompt système massif.
- Mémoire Longue : Capable de traiter des instructions au sein d'un contexte de 7k tokens.
⚠️ Limitations & Usage
En raison de sa taille (191k), le modèle est sensible à la qualité du prompt. Il est recommandé pour :
- Le test de structures grammaticales Nekoliennes.
- L'expérimentation de workflows d'inférence ultra-rapides.
📥 Accès & Sécurité
Comme pour l'ensemble de la collection de Clem, l'accès est soumis à une candidature restreinte (Gated Access) sur Hugging Face. Les demandes de type "chaotiques" seront systématiquement rejetées. 🛡️
- Downloads last month
- -
Model tree for Conlanger-LLM-CLEM/micro-nelya-instruct-v0
Base model
Conlanger-LLM-CLEM/micro-Nelya-neko