Spaces:

my-ai-stack
/

stack-2-9-demo

Sleeping

App Files Files Community

walidsobhie-code commited on Apr 8

Commit

f39e166

1 Parent(s): 969a9d8

Fix: Replace Slider with Number, remove Examples to avoid caching error

Browse files

Files changed (1) hide show

app.py +7 -13

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 """
 Stack 2.9 - HuggingFace Space
-Compatible with Gradio 6.x
 """
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
@@ -19,7 +19,7 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 print("Model loaded!")
-def generate(prompt, max_tokens=256, temperature=0.7):
     messages = [{"role": "user", "content": prompt}]
     text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
     inputs = tokenizer([text], return_tensors="pt")
@@ -27,8 +27,8 @@ def generate(prompt, max_tokens=256, temperature=0.7):
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=max_tokens,
-            temperature=temperature,
             do_sample=True,
             pad_token_id=tokenizer.pad_token_id or tokenizer.eos_token_id
         )
@@ -39,19 +39,13 @@ def generate(prompt, max_tokens=256, temperature=0.7):
 demo = gr.Interface(
     fn=generate,
     inputs=[
-        gr.Textbox(label="Prompt", placeholder="Write a Python function to calculate fibonacci...", lines=6),
-        gr.Slider(64, 512, value=256, label="Max tokens"),
-        gr.Slider(0.1, 1.0, value=0.7, label="Temperature"),
     ],
     outputs=gr.Textbox(label="Response", lines=10),
     title="Stack 2.9 Code Assistant",
     description="Powered by Qwen2.5-Coder-1.5B",
-    examples=[
-        ["Write a Python function to calculate fibonacci numbers"],
-        ["Explain what this code does: def foo(x): return x * 2"],
-        ["Write a SQL query to find duplicate emails"],
-        ["How do I handle exceptions in Python?"],
-    ]
 )
 demo.launch(server_name="0.0.0.0", server_port=7860)

 """
 Stack 2.9 - HuggingFace Space
+Gradio 6.x compatible
 """
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 )
 print("Model loaded!")
+def generate(prompt, max_tokens, temperature):
     messages = [{"role": "user", "content": prompt}]
     text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
     inputs = tokenizer([text], return_tensors="pt")
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=int(max_tokens),
+            temperature=float(temperature),
             do_sample=True,
             pad_token_id=tokenizer.pad_token_id or tokenizer.eos_token_id
         )
 demo = gr.Interface(
     fn=generate,
     inputs=[
+        gr.Textbox(label="Prompt", placeholder="Write a Python function to calculate fibonacci...", lines=4),
+        gr.Number(label="Max tokens", value=256, minimum=64, maximum=512),
+        gr.Number(label="Temperature", value=0.7, minimum=0.1, maximum=1.0),
     ],
     outputs=gr.Textbox(label="Response", lines=10),
     title="Stack 2.9 Code Assistant",
     description="Powered by Qwen2.5-Coder-1.5B",
 )
 demo.launch(server_name="0.0.0.0", server_port=7860)