|
|
--- |
|
|
language: |
|
|
- "es" |
|
|
license: "apache-2.0" |
|
|
tags: |
|
|
- "question-answering" |
|
|
- "spanish" |
|
|
- "ecuador" |
|
|
datasets: |
|
|
- "Jnaranjo/EcuadorWeb-QA" |
|
|
base_model: "Qwen/Qwen-1_8B" |
|
|
--- |
|
|
|
|
|
# Qwen-1.8B Ecuador QA |
|
|
|
|
|
fine tune de Qwen-1.8B para responder preguntas en español sobre Ecuador. |
|
|
|
|
|
## Descripción |
|
|
|
|
|
- **Modelo Base**: Qwen/Qwen-1_8B |
|
|
- **Dataset**: Jnaranjo/EcuadorWeb-QA (10,597 ejemplos) |
|
|
- **Idioma**: Español (contexto ecuatoriano) |
|
|
|
|
|
## Uso Con Transformers |
|
|
|
|
|
from transformers import AutoModelForCausalLM, AutoTokenizer |
|
|
model = AutoModelForCausalLM.from_pretrained("Jnaranjo/fine-tuned-qwen-ecuador-qa", trust_remote_code=True) |
|
|
tokenizer = AutoTokenizer.from_pretrained("Jnaranjo/fine-tuned-qwen-ecuador-qa", trust_remote_code=True) |
|
|
if tokenizer.pad_token is None: |
|
|
tokenizer.pad_token = tokenizer.eos_token |
|
|
pregunta = "¿Dónde se encuentra el estudio 108 Yoga?" |
|
|
prompt = f"Question: {pregunta}\nAnswer:" |
|
|
inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512) |
|
|
outputs = model.generate(**inputs, max_new_tokens=256, temperature=0.7, do_sample=True) |
|
|
respuesta = tokenizer.decode(outputs, skip_special_tokens=True)[len(prompt):].strip() |
|
|
print(f"Respuesta: {respuesta}") |
|
|
|
|
|
|
|
|
## Evaluación |
|
|
|
|
|
El modelo ha sido entrenado específicamente para responder preguntas sobre Ecuador, incluyendo información sobre lugares, cultura, historia y datos locales del país. |
|
|
|
|
|
## Licencia |
|
|
|
|
|
Este modelo está basado en Qwen-1.8B y mantiene las mismas condiciones de licencia del modelo base. |
|
|
|
|
|
|