Add SetFit ABSA model
Browse files- README.md +66 -71
- config_sentence_transformers.json +1 -1
- config_setfit.json +3 -4
- model.safetensors +1 -1
- model_head.pkl +2 -2
README.md
CHANGED
|
@@ -10,18 +10,20 @@ base_model: cointegrated/rubert-tiny2
|
|
| 10 |
metrics:
|
| 11 |
- accuracy
|
| 12 |
widget:
|
| 13 |
-
- text:
|
| 14 |
-
|
| 15 |
-
- text: '
|
| 16 |
-
|
| 17 |
-
|
| 18 |
-
|
| 19 |
-
- text: '
|
| 20 |
-
|
| 21 |
-
|
| 22 |
-
|
| 23 |
-
|
| 24 |
-
|
|
|
|
|
|
|
| 25 |
pipeline_tag: text-classification
|
| 26 |
inference: false
|
| 27 |
---
|
|
@@ -47,11 +49,11 @@ This model was trained within the context of a larger system for ABSA, which loo
|
|
| 47 |
- **Model Type:** SetFit
|
| 48 |
- **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
|
| 49 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
| 50 |
-
- **spaCy Model:**
|
| 51 |
- **SetFitABSA Aspect Model:** [isolation-forest/setfit-absa-aspect](https://huggingface.co/isolation-forest/setfit-absa-aspect)
|
| 52 |
- **SetFitABSA Polarity Model:** [isolation-forest/setfit-absa-polarity](https://huggingface.co/isolation-forest/setfit-absa-polarity)
|
| 53 |
- **Maximum Sequence Length:** 2048 tokens
|
| 54 |
-
- **Number of Classes:**
|
| 55 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
| 56 |
<!-- - **Language:** Unknown -->
|
| 57 |
<!-- - **License:** Unknown -->
|
|
@@ -63,11 +65,10 @@ This model was trained within the context of a larger system for ABSA, which loo
|
|
| 63 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
| 64 |
|
| 65 |
### Model Labels
|
| 66 |
-
| Label | Examples
|
| 67 |
-
|
| 68 |
-
| Positive | <ul><li>'
|
| 69 |
-
|
|
| 70 |
-
| Negative | <ul><li>'как в работе официантов так и в:Очень много недочетов как в работе официантов так и в блюдах . 1 .'</li><li>'так и в блюдах . 1 .:Очень много недочетов как в работе официантов так и в блюдах . 1 .'</li><li>'К большому удивлению пицца ( ещё раз:К большому удивлению пицца ( ещё раз - из детского меню ! ) была на столько острая , что и взрослые не смогли её есть , не говоря уже о ребенке .'</li></ul> |
|
| 71 |
|
| 72 |
## Uses
|
| 73 |
|
|
@@ -122,13 +123,12 @@ preds = model("The food was great, but the venue is just way too busy.")
|
|
| 122 |
### Training Set Metrics
|
| 123 |
| Training set | Min | Median | Max |
|
| 124 |
|:-------------|:----|:--------|:----|
|
| 125 |
-
| Word count |
|
| 126 |
|
| 127 |
| Label | Training Sample Count |
|
| 128 |
|:---------|:----------------------|
|
| 129 |
-
| Negative |
|
| 130 |
-
|
|
| 131 |
-
| Positive | 183 |
|
| 132 |
|
| 133 |
### Training Hyperparameters
|
| 134 |
- batch_size: (16, 2)
|
|
@@ -150,58 +150,53 @@ preds = model("The food was great, but the venue is just way too busy.")
|
|
| 150 |
### Training Results
|
| 151 |
| Epoch | Step | Training Loss | Validation Loss |
|
| 152 |
|:------:|:----:|:-------------:|:---------------:|
|
| 153 |
-
| 0.
|
| 154 |
-
| 0.
|
| 155 |
-
| 0.
|
| 156 |
-
| 0.
|
| 157 |
-
| 0.
|
| 158 |
-
| 0.
|
| 159 |
-
| 0.
|
| 160 |
-
| 0.
|
| 161 |
-
| 0.
|
| 162 |
-
| 0.
|
| 163 |
-
| 0.
|
| 164 |
-
| 0.
|
| 165 |
-
| 0.
|
| 166 |
-
| 0.
|
| 167 |
-
| 0.
|
| 168 |
-
| 0.
|
| 169 |
-
| 0.
|
| 170 |
-
| 0.
|
| 171 |
-
| 0.
|
| 172 |
-
| 0.
|
| 173 |
-
| 0.
|
| 174 |
-
| 0.
|
| 175 |
-
| 0.
|
| 176 |
-
| 0.
|
| 177 |
-
| 0.
|
| 178 |
-
| 0.
|
| 179 |
-
| 0.
|
| 180 |
-
| 0.
|
| 181 |
-
| 0.
|
| 182 |
-
| 0.
|
| 183 |
-
| 0.
|
| 184 |
-
| 0.
|
| 185 |
-
| 0.
|
| 186 |
-
| 0.
|
| 187 |
-
| 0.
|
| 188 |
-
| 0.
|
| 189 |
-
| 0.
|
| 190 |
-
| 0.
|
| 191 |
-
| 0.
|
| 192 |
-
| 0.
|
| 193 |
-
| 0.
|
| 194 |
-
| 0.
|
| 195 |
-
| 0.9075 | 2100 | 0.0033 | - |
|
| 196 |
-
| 0.9291 | 2150 | 0.0047 | - |
|
| 197 |
-
| 0.9507 | 2200 | 0.0048 | - |
|
| 198 |
-
| 0.9723 | 2250 | 0.0042 | - |
|
| 199 |
-
| 0.9939 | 2300 | 0.0043 | - |
|
| 200 |
|
| 201 |
### Framework Versions
|
| 202 |
- Python: 3.10.13
|
| 203 |
- SetFit: 1.0.3
|
| 204 |
-
- Sentence Transformers: 2.
|
| 205 |
- spaCy: 3.7.2
|
| 206 |
- Transformers: 4.39.3
|
| 207 |
- PyTorch: 2.1.2
|
|
|
|
| 10 |
metrics:
|
| 11 |
- accuracy
|
| 12 |
widget:
|
| 13 |
+
- text: а л а палтуса запеченного – х о:П о п р о б о в а л а палтуса запеченного
|
| 14 |
+
– х о р о ш , д а и к р а с и в о с м о т р и т с я н а т а р е л к е .
|
| 15 |
+
- text: 'с курицей , лосось со шпинатным соусом , чай облепиховый:При каждом новом
|
| 16 |
+
посещении я стараюсь пробовать новые блюда из меню , особенно мне понравились
|
| 17 |
+
: цезарь с курицей , лосось со шпинатным соусом , чай облепиховый и тирамису от
|
| 18 |
+
шеф повара .'
|
| 19 |
+
- text: ', но качество еды ее не украсило:Свадьба , конечно , прошла весело , но качество
|
| 20 |
+
еды ее не украсило .'
|
| 21 |
+
- text: найти уютное недорогое местечко в районе метро:Думаю , если стоит задача найти
|
| 22 |
+
уютное недорогое местечко в районе метро московская , то это наверно один из лучших
|
| 23 |
+
вариантов .
|
| 24 |
+
- text: они начали разнообразить кухню мясными блюдами ,:Хочется , чтобы мой отзыв
|
| 25 |
+
дошел до администрации , и они начали разнообразить кухню мясными блюдами , гарнирами
|
| 26 |
+
, интересными салатами и супами .
|
| 27 |
pipeline_tag: text-classification
|
| 28 |
inference: false
|
| 29 |
---
|
|
|
|
| 49 |
- **Model Type:** SetFit
|
| 50 |
- **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
|
| 51 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
| 52 |
+
- **spaCy Model:** ru_core_news_lg
|
| 53 |
- **SetFitABSA Aspect Model:** [isolation-forest/setfit-absa-aspect](https://huggingface.co/isolation-forest/setfit-absa-aspect)
|
| 54 |
- **SetFitABSA Polarity Model:** [isolation-forest/setfit-absa-polarity](https://huggingface.co/isolation-forest/setfit-absa-polarity)
|
| 55 |
- **Maximum Sequence Length:** 2048 tokens
|
| 56 |
+
- **Number of Classes:** 2 classes
|
| 57 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
| 58 |
<!-- - **Language:** Unknown -->
|
| 59 |
<!-- - **License:** Unknown -->
|
|
|
|
| 65 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
| 66 |
|
| 67 |
### Model Labels
|
| 68 |
+
| Label | Examples |
|
| 69 |
+
|:---------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
| 70 |
+
| Positive | <ul><li>'И порции " достойные ":И порции " достойные " .'</li><li>'Салаты вообще оказались вкуснейшими:Салаты вообще оказались вкуснейшими .'</li><li>'порадовала , большая пивная тарелка , действительно оказалась:Кухня порадовала , большая пивная тарелка , действительно оказалась большой и вкусной !'</li></ul> |
|
| 71 |
+
| Negative | <ul><li>'Потом официантка как будто пропала:Потом официантка как будто пропала , было не дозваться , чтобы что - то дозаказать , очень долго приходилось ждать , в итоге посчитали неправильно , в счет внесли на 2 пункта больше , чем мы заказывали .'</li><li>'Обслуживание не впечатлило .:Обслуживание не впечатлило .'</li><li>'приятно удивлена " китайским интерьером " - диванчики:Была приятно удивлена " китайским интерьером " - диванчики как в бистро , скатерти на столах по типу а - ля столовая , европейские светильники / люстры , в общем в плане интерьера китайского никакого абсолютно !'</li></ul> |
|
|
|
|
| 72 |
|
| 73 |
## Uses
|
| 74 |
|
|
|
|
| 123 |
### Training Set Metrics
|
| 124 |
| Training set | Min | Median | Max |
|
| 125 |
|:-------------|:----|:--------|:----|
|
| 126 |
+
| Word count | 3 | 28.4766 | 92 |
|
| 127 |
|
| 128 |
| Label | Training Sample Count |
|
| 129 |
|:---------|:----------------------|
|
| 130 |
+
| Negative | 128 |
|
| 131 |
+
| Positive | 128 |
|
|
|
|
| 132 |
|
| 133 |
### Training Hyperparameters
|
| 134 |
- batch_size: (16, 2)
|
|
|
|
| 150 |
### Training Results
|
| 151 |
| Epoch | Step | Training Loss | Validation Loss |
|
| 152 |
|:------:|:----:|:-------------:|:---------------:|
|
| 153 |
+
| 0.0005 | 1 | 0.2196 | - |
|
| 154 |
+
| 0.0242 | 50 | 0.2339 | - |
|
| 155 |
+
| 0.0484 | 100 | 0.2258 | - |
|
| 156 |
+
| 0.0727 | 150 | 0.246 | - |
|
| 157 |
+
| 0.0969 | 200 | 0.1963 | - |
|
| 158 |
+
| 0.1211 | 250 | 0.18 | - |
|
| 159 |
+
| 0.1453 | 300 | 0.1176 | - |
|
| 160 |
+
| 0.1696 | 350 | 0.0588 | - |
|
| 161 |
+
| 0.1938 | 400 | 0.0482 | - |
|
| 162 |
+
| 0.2180 | 450 | 0.1131 | - |
|
| 163 |
+
| 0.2422 | 500 | 0.0134 | - |
|
| 164 |
+
| 0.2665 | 550 | 0.0415 | - |
|
| 165 |
+
| 0.2907 | 600 | 0.0144 | - |
|
| 166 |
+
| 0.3149 | 650 | 0.012 | - |
|
| 167 |
+
| 0.3391 | 700 | 0.0091 | - |
|
| 168 |
+
| 0.3634 | 750 | 0.0055 | - |
|
| 169 |
+
| 0.3876 | 800 | 0.0054 | - |
|
| 170 |
+
| 0.4118 | 850 | 0.0055 | - |
|
| 171 |
+
| 0.4360 | 900 | 0.0072 | - |
|
| 172 |
+
| 0.4603 | 950 | 0.0094 | - |
|
| 173 |
+
| 0.4845 | 1000 | 0.0054 | - |
|
| 174 |
+
| 0.5087 | 1050 | 0.0045 | - |
|
| 175 |
+
| 0.5329 | 1100 | 0.003 | - |
|
| 176 |
+
| 0.5572 | 1150 | 0.0067 | - |
|
| 177 |
+
| 0.5814 | 1200 | 0.0041 | - |
|
| 178 |
+
| 0.6056 | 1250 | 0.0048 | - |
|
| 179 |
+
| 0.6298 | 1300 | 0.0053 | - |
|
| 180 |
+
| 0.6541 | 1350 | 0.0048 | - |
|
| 181 |
+
| 0.6783 | 1400 | 0.0038 | - |
|
| 182 |
+
| 0.7025 | 1450 | 0.0037 | - |
|
| 183 |
+
| 0.7267 | 1500 | 0.0031 | - |
|
| 184 |
+
| 0.7510 | 1550 | 0.0038 | - |
|
| 185 |
+
| 0.7752 | 1600 | 0.0032 | - |
|
| 186 |
+
| 0.7994 | 1650 | 0.0039 | - |
|
| 187 |
+
| 0.8236 | 1700 | 0.0032 | - |
|
| 188 |
+
| 0.8479 | 1750 | 0.0023 | - |
|
| 189 |
+
| 0.8721 | 1800 | 0.0029 | - |
|
| 190 |
+
| 0.8963 | 1850 | 0.0041 | - |
|
| 191 |
+
| 0.9205 | 1900 | 0.0026 | - |
|
| 192 |
+
| 0.9448 | 1950 | 0.0027 | - |
|
| 193 |
+
| 0.9690 | 2000 | 0.0035 | - |
|
| 194 |
+
| 0.9932 | 2050 | 0.003 | - |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 195 |
|
| 196 |
### Framework Versions
|
| 197 |
- Python: 3.10.13
|
| 198 |
- SetFit: 1.0.3
|
| 199 |
+
- Sentence Transformers: 2.7.0
|
| 200 |
- spaCy: 3.7.2
|
| 201 |
- Transformers: 4.39.3
|
| 202 |
- PyTorch: 2.1.2
|
config_sentence_transformers.json
CHANGED
|
@@ -1,6 +1,6 @@
|
|
| 1 |
{
|
| 2 |
"__version__": {
|
| 3 |
-
"sentence_transformers": "2.
|
| 4 |
"transformers": "4.39.3",
|
| 5 |
"pytorch": "2.1.2"
|
| 6 |
},
|
|
|
|
| 1 |
{
|
| 2 |
"__version__": {
|
| 3 |
+
"sentence_transformers": "2.7.0",
|
| 4 |
"transformers": "4.39.3",
|
| 5 |
"pytorch": "2.1.2"
|
| 6 |
},
|
config_setfit.json
CHANGED
|
@@ -1,10 +1,9 @@
|
|
| 1 |
{
|
| 2 |
-
"spacy_model": "
|
| 3 |
-
"span_context": 3,
|
| 4 |
"labels": [
|
| 5 |
"Negative",
|
| 6 |
-
"Neutral",
|
| 7 |
"Positive"
|
| 8 |
],
|
| 9 |
-
"normalize_embeddings": false
|
|
|
|
| 10 |
}
|
|
|
|
| 1 |
{
|
| 2 |
+
"spacy_model": "ru_core_news_lg",
|
|
|
|
| 3 |
"labels": [
|
| 4 |
"Negative",
|
|
|
|
| 5 |
"Positive"
|
| 6 |
],
|
| 7 |
+
"normalize_embeddings": false,
|
| 8 |
+
"span_context": 3
|
| 9 |
}
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 116781184
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:74662c65ee63b0fd558a7b2223fa5df50082cb515d3767a495971ba94770353b
|
| 3 |
size 116781184
|
model_head.pkl
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
-
size
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:b0d79bc7edf9389f04a1b1d034cbbd9d5f5e009c7d403fdee370b2fe9d01c7dd
|
| 3 |
+
size 3391
|