Spaces:

AxL95
/

medically

Runtime error

App Files Files Community

AxL95 commited on May 1

Commit

b9bcf72

verified ·

1 Parent(s): cdcf9ae

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -47

app.py CHANGED Viewed

@@ -4,17 +4,12 @@ from fastapi.responses import JSONResponse
 from fastapi.staticfiles import StaticFiles
 from huggingface_hub import InferenceClient
 from sentence_transformers import SentenceTransformer
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-import torch
 from fastapi import Request
 import requests
-from huggingface_hub import login
 import numpy as np
 import argparse
 import os
-from fastapi import HTTPException
 HOST = os.environ.get("API_URL", "0.0.0.0")
 PORT = os.environ.get("PORT", 7860)
@@ -35,36 +30,8 @@ app.add_middleware(
     allow_headers=["*"],
 )
-HF_TOKEN = os.getenv("REACT_APP_HF_TOKEN")
-if HF_TOKEN is None:
-    raise RuntimeError(
-        "Définis la variable d’environnement HF_TOKEN dans les Secrets de ton Space."
-    )
-# équivalent de `huggingface-cli login`
-login(token=HF_TOKEN)
-# Charge le tokenizer et le modèle
-tokenizer = AutoTokenizer.from_pretrained(
-    "mistralai/Mistral-7B-Instruct-v0.3",
-    trust_remote_code=True,
-    use_auth_token=HF_TOKEN,
-)
-model = AutoModelForCausalLM.from_pretrained(
-    "mistralai/Mistral-7B-Instruct-v0.3",
-    trust_remote_code=True,
-    use_auth_token=HF_TOKEN,
-    torch_dtype=torch.float32,
-    low_cpu_mem_usage=True,
-)
-chat_pipeline = pipeline(
-    "text-generation",
-    model=model,
-    tokenizer=tokenizer,
-    device=-1,                      # -1 = CPU
-    max_new_tokens=512,
-    temperature=0.7,
-    do_sample=True
-)
 embedder = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v1')
 @app.post("/api/embed")
@@ -97,24 +64,25 @@ async def chat(request: Request):
     user_message = data.get("message", "").strip()
     if not user_message:
         raise HTTPException(status_code=400, detail="Le champ 'message' est requis.")
-    # Construit le prompt
-    prompt = (
-        "Tu es un assistant médical spécialisé en schizophrénie.\n"
-        "Utilisateur : " + user_message + "\n"
-        "Assistant :"
-    )
     try:
-        outputs = chat_pipeline(
-            prompt,
-            return_full_text=False
         )
-        bot_msg = outputs[0]["generated_text"].strip()
         return {"response": bot_msg}
     except Exception as e:
-        raise HTTPException(status_code=502, detail=f"Erreur d’inférence locale : {e}")
 @app.get("/data")

 from fastapi.staticfiles import StaticFiles
 from huggingface_hub import InferenceClient
 from sentence_transformers import SentenceTransformer
 from fastapi import Request
 import requests
 import numpy as np
 import argparse
 import os
 HOST = os.environ.get("API_URL", "0.0.0.0")
 PORT = os.environ.get("PORT", 7860)
     allow_headers=["*"],
 )
+app = FastAPI()
 embedder = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v1')
 @app.post("/api/embed")
     user_message = data.get("message", "").strip()
     if not user_message:
         raise HTTPException(status_code=400, detail="Le champ 'message' est requis.")
     try:
+        # Appel au modèle en mode chat
+        completion = hf_client.chat.completions.create(
+            model="mistralai/Mistral-7B-Instruct-v0.3",
+            messages=[
+                {"role": "system", "content": "Tu es un assistant médical spécialisé en schizophrénie."},
+                {"role": "user",   "content": user_message}
+            ],
+            max_tokens=512,
+            temperature=0.7,
         )
+        bot_msg = completion.choices[0].message.content
         return {"response": bot_msg}
     except Exception as e:
+        # En cas d'erreur d'inférence
+        raise HTTPException(status_code=502, detail=f"Erreur d'inférence HF : {e}")
 @app.get("/data")