Spaces:

jlov7
/

Dynamic-Function-Calling-Agent

Sleeping

jlov7 commited on Jul 21

Commit

5410dc5

1 Parent(s): beb266c

fix: use base model for demo (remove LoRA adapter dependency)

Files changed (2) hide show

requirements.txt CHANGED Viewed

@@ -1,6 +1,5 @@
 torch>=2.0.0
 transformers>=4.30.0
-peft>=0.4.0
 jsonschema>=4.0.0
 datasets>=2.0.0
 gradio>=5.0.0

 torch>=2.0.0
 transformers>=4.30.0
 jsonschema>=4.0.0
 datasets>=2.0.0
 gradio>=5.0.0

test_constrained_model.py CHANGED Viewed

@@ -9,13 +9,13 @@ import torch
 import json
 import jsonschema
 from transformers import AutoTokenizer, AutoModelForCausalLM
-from peft import PeftModel
 from typing import Dict, List
 import time
 def load_trained_model():
     """Load our intensively trained model."""
-    print("🔄 Loading intensively trained SmolLM3-3B...")
     # Load base model
     base_model_name = "HuggingFaceTB/SmolLM3-3B"
@@ -29,10 +29,9 @@ def load_trained_model():
         device_map="mps" if torch.backends.mps.is_available() else "auto"
     )
-    # Load LoRA weights
-    print("🔧 Loading LoRA adapter...")
-    model = PeftModel.from_pretrained(model, "./smollm3_robust")
-    model = model.merge_and_unload()  # Merge for faster inference
     print("✅ Trained model loaded successfully")
     return model, tokenizer

 import json
 import jsonschema
 from transformers import AutoTokenizer, AutoModelForCausalLM
+# from peft import PeftModel  # Not needed for base model demo
 from typing import Dict, List
 import time
 def load_trained_model():
     """Load our intensively trained model."""
+    print("🔄 Loading SmolLM3-3B (base model for demo)...")
     # Load base model
     base_model_name = "HuggingFaceTB/SmolLM3-3B"
         device_map="mps" if torch.backends.mps.is_available() else "auto"
     )
+    # Note: Using base model for demo (LoRA adapter not included to keep repo size small)
+    print("🔧 Using base model (LoRA adapter excluded for size constraints)...")
+    # For production deployment, upload LoRA adapter to HF Hub and load from there
     print("✅ Trained model loaded successfully")
     return model, tokenizer