NaA-IA
/

Prixa-regression

+---
+license: mit
+language:
+- fr
+pipeline_tag: tabular-regression
+tags:
+- Saveurs
+- ML
+- Prix articles
+---
+.# 📜 Carte Modèle : Prixa-regression (V2)
+![Prixa](http://www.image-heberg.fr/files/17592589351737387422.jpg)
+## 🎯 Aperçu du Modèle
+Ce modèle est un **Régresseur Linéaire Multi-Variable** simple développé avec **PyTorch**. Son objectif principal est de prédire le prix d'un produit (Yaourt, Tiramisu, Crème) en fonction de deux caractéristiques d'entrée : l'**Article** et la **Saveur**.
+Il a été entraîné *from scratch* (à partir de zéro) pour illustrer la capacité d'un modèle simple à déduire des relations de prix complexes, en séparant la contribution du type de produit et celle de l'arôme.
+  * **Auteur :** Clemylia
+  * **Framework :** PyTorch (`torch.nn`)
+  * **Type de Tâche :** Régression (Prédiction de prix continu)
+  * **Version :** V2 (avec encodage Article + Saveur)
+-----
+## 🛠️ Utilisation et Implémentation
+Ce modèle est un module `nn.Linear` qui attend un vecteur d'entrée de taille 8, encodé en **One-Hot Encoding (OHE)**.
+### 1\. Structure du Modèle
+La classe Python est simple :
+```python
+import torch.nn as nn
+class PricePredictor(nn.Module):
+    def __init__(self, input_size, output_size):
+        super(PricePredictor, self).__init__()
+        # Couche Linéaire unique (Régression Linéaire)
+        self.fc = nn.Linear(input_size, output_size)
+    def forward(self, x):
+        return self.fc(x)
+```
+### 2\. Mappings des Données (CRUCIAL)
+Pour que le modèle fonctionne, l'utilisateur doit encoder les articles et les saveurs dans l'ordre exact utilisé lors de l'entraînement. L'entrée de taille **8** est la concaténation des deux vecteurs OHE (`[Saveur OHE] + [Article OHE]`).
+#### Mappings des 5 Saveurs (Index 0 à 4)
+| Saveur | Index (Pos. 0-4) |
+| :--- | :--- |
+| `fraise` | 0 |
+| `banane` | 1 |
+| `pêche` | 2 |
+| `framboise` | 3 |
+| `moyen` | 4 |
+#### Mappings des 3 Articles (Index 5 à 7)
+| Article | Index (Pos. 5-7) |
+| :--- | :--- |
+| `yaourt` | 5 |
+| `tiramisu` | 6 |
+| `crème` | 7 |
+### 3\. Exemple d'Inférence (Prédiction)
+Pour prédire le prix d'un **Tiramisu à la Pêche** :
+  * **Pêche** est à l'index 2.
+  * **Tiramisu** est à l'index 6 (soit la position 1 dans le vecteur Article, ou 5+1).
+Le vecteur d'entrée doit être :
+$$\mathbf{X}_{\text{Tiramisu Pêche}} = [0, 0, 1, 0, 0, \quad 0, 1, 0]$$
+**Code d'Infèrence :**
+```python
+from huggingface_hub import hf_hub_download
+import torch
+# 1. Télécharger le modèle (Exemple de chargement)
+downloaded_path = hf_hub_download(repo_id="Clemylia/Prixa-regression", filename="pytorch_model.bin")
+# 2. Définir l'architecture (INPUT_SIZE = 8)
+INPUT_SIZE = 8
+model = PricePredictor(INPUT_SIZE, 1)
+model.load_state_dict(torch.load(downloaded_path))
+model.eval()
+# 3. Créer le Tenseur d'Entrée
+# Pour Tiramisu Pêche: [0, 0, 1, 0, 0, 0, 1, 0]
+input_data = [0, 0, 1, 0, 0, 0, 1, 0]
+input_tensor = torch.tensor([input_data], dtype=torch.float32)
+# 4. Prédiction
+with torch.no_grad():
+    predicted_price = model(input_tensor).item()
+    print(f"Prix prédit : {predicted_price:.2f}€") # Résultat attendu ≈ 5.78€
+```
+-----
+## 📊 Performances et Limites
+### Performances (Résultats de la Déduction)
+Le modèle a montré une bonne capacité à déduire le prix des combinaisons non vues en apprenant deux concepts distincts :
+1.  **Prime de l'Article :** Les prix du Tiramisu sont supérieurs à ceux du Yaourt, et ceux de la Crème sont les plus élevés.
+2.  **Prime de la Saveur :** La saveur Framboise ajoute un coût significatif, tandis que la Banane ajoute très peu.
+| Prédiction | Résultat du Modèle | Comportement |
+| :--- | :--- | :--- |
+| **Crème Framboise** | 9.80€ | Combinaison la plus chère (Crème + Framboise) |
+| **Tiramisu Banane** | 6.14€ | Prix intermédiaire (Base Tiramisu + Saveur Banane) |
+### Limites
+Étant un modèle de régression **strictement linéaire**, il présente des limites :
+  * **Pas d'Interaction Non-Linéaire :** Il ne peut pas apprendre que **l'effet d'une saveur dépend de l'article**. Par exemple, il ne peut pas apprendre que l'arôme "Moyen" est seulement utilisé pour les desserts haut de gamme, car il traite l'Article et la Saveur comme des variables indépendantes.
+  * **Petit Jeu de Données :** L'entraînement s'est fait sur un jeu de données très limité, ce qui le rend sujet à l'**overfitting** (surapprentissage) si les données étaient plus complexes.
+-----
+## 📚 Références
+  * **Auteur :** Clemylia