Spaces:

Sofa321
/

IndoBot-AI

Sleeping

App Files Files Community

Sofa321 commited on Dec 27, 2024

Commit

37ed814

verified ·

1 Parent(s): 3b3cc34

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -44

app.py CHANGED Viewed

@@ -1,55 +1,48 @@
-import pandas as pd
-from sklearn.feature_extraction.text import CountVectorizer
-from sklearn.naive_bayes import MultinomialNB
 import gradio as gr
-# Dataset Bahasa Indonesia
-data = {
-    "pertanyaan": [
-        "Halo",
-        "Apa kabar?",
-        "Siapa namamu?",
-        "Apa hobi kamu?",
-        "Ceritakan lelucon"
-    ],
-    "jawaban": [
-        "Hai juga!",
-        "Aku baik, bagaimana dengan kamu?",
-        "Aku adalah IndoBot AI.",
-        "Hobiku membantu orang seperti kamu!",
-        "Kenapa ayam menyeberang jalan? Untuk ke sisi lain!"
-    ]
-}
-df = pd.DataFrame(data)
-# Preprocessing Data
-vectorizer = CountVectorizer()
-X = vectorizer.fit_transform(df['pertanyaan'])
-y = df['jawaban']
-# Model Klasifikasi
-model = MultinomialNB()
-model.fit(X, y)
 # Fungsi Chatbot
-def chatbot_respon(input_text):
-    input_vec = vectorizer.transform([input_text])
-    try:
-        response = model.predict(input_vec)[0]
-    except:
-        response = "Maaf, aku tidak mengerti pertanyaanmu."
-    return response
-# Interface Gradio
-def gradio_chatbot(user_input):
-    return chatbot_respon(user_input)
 interface = gr.Interface(
-    fn=gradio_chatbot,
     inputs=gr.Textbox(lines=2, placeholder="Tanyakan sesuatu..."),
     outputs="text",
-    title="IndoBot AI",
-    description="IndoBot AI adalah chatbot sederhana yang memahami bahasa Indonesia. Coba tanyakan sesuatu!"
 )
 if __name__ == "__main__":

+from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification
 import gradio as gr
+# Load Model Pre-trained (BERT)
+MODEL_NAME = "indobenchmark/indobert-base-p2"
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForSequenceClassification.from_pretrained(MODEL_NAME, num_labels=2)
+# Pipeline untuk prediksi teks
+classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
 # Fungsi Chatbot
+def chatbot_respon(user_input):
+    # Predefined responses based on intent
+    predefined_responses = {
+        "halo": "Hai juga! Ada yang bisa aku bantu?",
+        "apa kabar": "Aku baik, bagaimana dengan kamu?",
+        "siapa namamu": "Aku adalah IndoBot AI, teman bicaramu.",
+        "ceritakan lelucon": "Kenapa ayam menyeberang jalan? Untuk ke sisi lain!"
+    }
+    # Cari respons di predefined
+    for key, response in predefined_responses.items():
+        if key in user_input.lower():
+            return response
+    # Jika tidak ada di predefined, gunakan model
+    prediction = classifier(user_input)[0]
+    label = prediction['label']
+    confidence = prediction['score']
+    if confidence > 0.7:  # Threshold confidence
+        if label == "LABEL_0":
+            return "Aku tidak yakin dengan pertanyaanmu, bisakah kamu menjelaskannya lebih lanjut?"
+        elif label == "LABEL_1":
+            return "Tentu! Aku bisa membantu menjelaskan topik ini lebih jauh."
+    return "Maaf, aku tidak mengerti pertanyaanmu."
+# Gradio Interface
 interface = gr.Interface(
+    fn=chatbot_respon,
     inputs=gr.Textbox(lines=2, placeholder="Tanyakan sesuatu..."),
     outputs="text",
+    title="IndoBot AI - Lebih Pintar",
+    description="IndoBot AI adalah chatbot berbasis bahasa Indonesia dengan pemahaman lebih mendalam. Tanyakan sesuatu!"
 )
 if __name__ == "__main__":