SentenceTransformer based on intfloat/multilingual-e5-base
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-base on the core_uk and jargonisms_uk datasets. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-base
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Dot Product
- Training Datasets:- core_uk
- jargonisms_uk
 
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
RZTKSentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach")
# Run inference
sentences = [
    'query: чоловічіпіжами',
    'passage: Піжама чоловіча Homewear MAD 19544 M Noir/marine (3700465519857) Чоловічі піжами Homewear MAD Сезон Літній Розмір M Колір Чорний Колір Морська хвиля Матеріал Трикотаж Матеріал Бавовна Принт Однотонний Тип Піжамні шорти Тип комплекту Шорти+футболка',
    'passage: Ноутбук 15.6FM/i7-1255U/16/1TB SSD/Intel Iris XE/D OS/F/BL/Black ThinkBook 15 G4 IAP Ноутбуки Lenovo Колір Сірий',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
RZTKInformation Retrieval
- Datasets: test-core-uk--matryoshka_dim-768--,test-core-ru--matryoshka_dim-768--,typos-uk--matryoshka_dim-768--,typos-ru--matryoshka_dim-768--,transliterations-uk--matryoshka_dim-768--,transliterations-ru--matryoshka_dim-768--,options-uk--matryoshka_dim-768--,options-ru--matryoshka_dim-768--,rusisms-uk--matryoshka_dim-768--,rusisms-ru--matryoshka_dim-768--,test-jargonisms-uk--matryoshka_dim-768--,test-jargonisms-ru--matryoshka_dim-768--,vespa-uk--matryoshka_dim-768--andvespa-ru--matryoshka_dim-768--
- Evaluated with sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator
| Metric | test-core-uk--matryoshka_dim-768-- | test-core-ru--matryoshka_dim-768-- | typos-uk--matryoshka_dim-768-- | typos-ru--matryoshka_dim-768-- | transliterations-uk--matryoshka_dim-768-- | transliterations-ru--matryoshka_dim-768-- | options-uk--matryoshka_dim-768-- | options-ru--matryoshka_dim-768-- | rusisms-uk--matryoshka_dim-768-- | rusisms-ru--matryoshka_dim-768-- | test-jargonisms-uk--matryoshka_dim-768-- | test-jargonisms-ru--matryoshka_dim-768-- | vespa-uk--matryoshka_dim-768-- | vespa-ru--matryoshka_dim-768-- | 
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| dot_accuracy_10 | 0.9921 | 0.9921 | 0.9803 | 0.9803 | 0.8556 | 0.8584 | 1.0 | 1.0 | 1.0 | 1.0 | 0.9744 | 0.9744 | 0.9348 | 0.9348 | 
| dot_precision_10 | 0.4021 | 0.401 | 0.3837 | 0.3801 | 0.1998 | 0.2023 | 0.3388 | 0.3376 | 0.7242 | 0.7198 | 0.6282 | 0.6231 | 0.7174 | 0.7043 | 
| dot_recall_10 | 0.4782 | 0.4783 | 0.4583 | 0.4544 | 0.3938 | 0.3974 | 0.4852 | 0.4834 | 0.3797 | 0.3766 | 0.4196 | 0.4174 | 0.2483 | 0.2406 | 
| dot_ndcg_10 | 0.5967 | 0.5962 | 0.5591 | 0.5529 | 0.4768 | 0.4802 | 0.5786 | 0.5739 | 0.8232 | 0.8205 | 0.7656 | 0.7538 | 0.7983 | 0.7857 | 
| dot_mrr_10 | 0.8874 | 0.8924 | 0.8383 | 0.8288 | 0.7681 | 0.7702 | 0.9 | 0.888 | 0.9571 | 0.9628 | 0.9282 | 0.8983 | 0.8926 | 0.8878 | 
| dot_map_60 | 0.4291 | 0.4277 | 0.3961 | 0.3918 | 0.3651 | 0.3674 | 0.4183 | 0.4142 | 0.4704 | 0.4704 | 0.4487 | 0.4411 | 0.5878 | 0.5824 | 
Training Details
Training Datasets
core_uk
- Dataset: core_uk
- Size: 47,443,077 training samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 6 tokens
- mean: 11.36 tokens
- max: 45 tokens
 - min: 20 tokens
- mean: 97.0 tokens
- max: 512 tokens
 
- Samples:query text query: бюстгальтер балалоумpassage: Комплект нижньої білизни бюстгальтер формованая чашка і стрінги Balaloum 70В-S гіркий шоколад (9271К) Комплекти білизни Balaloum Посадка Середня Країна реєстрації бренда Італія Країна-виробник товару Китай Розмір 70B-S Стиль Романтичний Стиль Класичний Колір Шоколадний Колір Чорний Матеріал Поліамід Матеріал Бавовна Матеріал Еластан Матеріал Віскоза Чашка На кісточках (на каркасах) Трусики Стринги Форма бюстгальтера Балконет Вид комплекту З бюстгальтеромquery: терморегулятор с wifi для теплых полов nexanspassage: Тепла підлога Nexans TXLP/2R двожильний кабель 840 Вт 5.0 - 6.2 м2 в комплекті з Wi-Fi Black терморегулятором (0878) Нагрівальні кабелі Nexans Гарантія 20 років Площа 5 - 6.2query: магазин для ак 5,45 на 30 патроновpassage: Підсумок PA m2 під два магазини АК 23х10х6 см (MOLLE, подсумок на разгрузку, жилет) EFPABK23 Тактичні сумки та підсумки EasyFit Матеріал Cordura Колір Чорний Призначення Для магазинів довгодульної зброї Тип Підсумки Кількість вантажних місць 1 Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
jargonisms_uk
- Dataset: jargonisms_uk
- Size: 3,162,050 training samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 7 tokens
- mean: 12.96 tokens
- max: 45 tokens
 - min: 15 tokens
- mean: 113.45 tokens
- max: 512 tokens
 
- Samples:query text query: лифчик балалоумpassage: Комплект нижньої білизни бюстгальтер формованая чашка і стрінги Balaloum 70В-S гіркий шоколад (9271К) Комплекти білизни Balaloum Посадка Середня Країна реєстрації бренда Італія Країна-виробник товару Китай Розмір 70B-S Стиль Романтичний Стиль Класичний Колір Шоколадний Колір Чорний Матеріал Поліамід Матеріал Бавовна Матеріал Еластан Матеріал Віскоза Чашка На кісточках (на каркасах) Трусики Стринги Форма бюстгальтера Балконет Вид комплекту З бюстгальтеромquery: трусішки чоловічі jiber 127passage: Чоловічі сімейні труси Jiber сірі 127 L Труси чоловічі Jiber Модель Боксери Країна-виробник товару Туреччина Розмір L Колір Сірий Принт Однотоннийquery: акум на xboxpassage: Акумуляторна батарея Dobe TYX-2610B для Xbox Series S/X 800mAh Black Ігрові маніпулятори й аксесуари до консолей Dobe Тип Аксесуари Сумісність Microsoft Xbox Series S Кількість предметів, шт 1 Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
Evaluation Datasets
core_uk
- Dataset: core_uk
- Size: 3,220 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 10.66 tokens
- max: 16 tokens
 - min: 19 tokens
- mean: 114.2 tokens
- max: 512 tokens
 
- Samples:query text query: лампочка е27passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKAquery: лампочка е27passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKAquery: лампочка е27passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
core_ru
- Dataset: core_ru
- Size: 3,220 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 10.66 tokens
- max: 16 tokens
 - min: 18 tokens
- mean: 109.38 tokens
- max: 512 tokens
 
- Samples:query text query: лампочка е27passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKAquery: лампочка е27passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKAquery: лампочка е27passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
typos_uk
- Dataset: typos_uk
- Size: 3,220 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 11.58 tokens
- max: 17 tokens
 - min: 19 tokens
- mean: 114.2 tokens
- max: 512 tokens
 
- Samples:query text query: лампочка е7passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKAquery: лампочка е7passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKAquery: лампочка е7passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
typos_ru
- Dataset: typos_ru
- Size: 3,220 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 11.58 tokens
- max: 17 tokens
 - min: 18 tokens
- mean: 109.38 tokens
- max: 512 tokens
 
- Samples:query text query: лампочка е7passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKAquery: лампочка е7passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKAquery: лампочка е7passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
transliterations_uk
- Dataset: transliterations_uk
- Size: 13,144 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 7 tokens
- mean: 10.38 tokens
- max: 56 tokens
 - min: 16 tokens
- mean: 108.83 tokens
- max: 512 tokens
 
- Samples:query text query: апиэуpassage: Зволожувальний лактокрем для обличчя A'pieu Lactobacillus 50 мл (8809643517201) Крем для обличчя A'pieu Клас косметики Мідл-маркет Час застосування Ніч Вік Від 18 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 50 мл Вид Крем Сфера застосування Обличчя Тип шкіри Суха Тип шкіри Нормальна Призначення Відновлююче Призначення Зволожувальне Доставка Доставка в магазини ROZETKAquery: апиэуpassage: Тональний засіб A'pieu Клас косметики Мідл-маркетquery: апиэуpassage: Емульсія мінеральна A'pieu Aqua Marine 180 мл (8809530043608) Засіб для вмивання A'pieu Клас косметики Натуральна Час застосування Універсально Вік Від 20 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Серія Aqua Marine Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 180 мл Вид Емульсія Дія Тонізує Дія Зволожує Дія Очищає Тип шкіри Для всіх типів Призначення Зволожувальне Тип гарантійного талона Без гарантійного талона Можливість доставки Почтомати
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
transliterations_ru
- Dataset: transliterations_ru
- Size: 13,144 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 7 tokens
- mean: 10.38 tokens
- max: 56 tokens
 - min: 21 tokens
- mean: 105.61 tokens
- max: 512 tokens
 
- Samples:query text query: апиэуpassage: Увлажняющий лакто-крем для лица A'pieu Lactobacillus 50 мл (8809643517201) Крем для лица A'pieu Класс косметики Миддл-маркет Время применения Ночь Возраст От 18 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Страна-производитель товара Республика Корея (Южная Корея) Объем 50 мл Вид Крем Область применения Лицо Тип кожи Сухая Тип кожи Нормальная Назначение Восстанавливающее Назначение Увлажняющее Доставка Доставка в магазины ROZETKAquery: апиэуpassage: Воздушный хлопковый кушон с матовым финишем. Air-Fit A'pieu Cushion PPOSONG SPF50+/PA+++ 13,5g A'pieu Тональное средство A'pieu Класс косметики Миддл-маркетquery: апиэуpassage: Эмульсия минеральная A'pieu Aqua Marine 180 мл (8809530043608) Средство для умывания A'pieu Класс косметики Натуральная Время применения Универсально Возраст От 20 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Серия Aqua Marine Страна-производитель товара Республика Корея (Южная Корея) Объем 180 мл Вид Эмульсия Действие Тонизирует Действие Увлажняет Действие Очищает Тип кожи Для всех типов Назначение Увлажняющее Тип гарантийного талона Без гарантийного талона Возможность доставки Почтоматы
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
options_uk
- Dataset: options_uk
- Size: 1,442 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 10.71 tokens
- max: 22 tokens
 - min: 18 tokens
- mean: 165.12 tokens
- max: 512 tokens
 
- Samples:query text query: спортивные шорты женскиеpassage: Спортивні шорти жіночі Traum 2410-17 M (44-46) Чорні (4820024101721) Жіночі спортивні шорти Traum Сезон Осінній Сезон Літній Сезон Весняний Сезон Демісезонний Кількість вантажних місць 1 Довжина Коротка Країна реєстрації бренда Україна Країна-виробник товару Україна Декор З лампасами Розмір 46 Розмір 44 Стиль Спортивний Колір Чорний Матеріал Трикотаж Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Тип шортів Прості шорти Доставка Доставка в магазини ROZETKAquery: спортивные шорты женскиеpassage: Спортивні шорти жіночі ISSA PLUS 11377 S Чорні (issa2000239538884) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір S Стиль Спортивний Колір Чорний Матеріал Поліестер Матеріал Поліамід Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Доставка Доставка в магазини ROZETKAquery: спортивные шорты женскиеpassage: Спортивні шорти жіночі ISSA PLUS 7770 L Чорні (issa2000260293349) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Довжина Подовжена Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір L Стиль Спортивний Колір Чорний Матеріал Поліестер Тип гарантійного талона Гарантія по чеку Доставка Premium Принт Напис Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
options_ru
- Dataset: options_ru
- Size: 1,442 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 8 tokens
- mean: 10.71 tokens
- max: 22 tokens
 - min: 23 tokens
- mean: 159.8 tokens
- max: 512 tokens
 
- Samples:query text query: спортивные шорты женскиеpassage: Спортивные шорты женские Traum 2410-17 M (44-46) Черные (4820024101721) Женские спортивные шорты Traum Сезон Осенний Сезон Летний Сезон Весенний Сезон Демисезонный Количество грузовых мест 1 Длина Короткая Страна регистрации бренда Украина Страна-производитель товара Украина Декор С лампасами Размер 46 Размер 44 Стиль Спортивный Цвет Черный Материал Трикотаж Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Тип шорт Простые шорты Доставка Доставка в магазины ROZETKAquery: спортивные шорты женскиеpassage: Спортивные шорты женские ISSA PLUS 11377 S Черные (issa2000239538884) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Украина Размер S Стиль Спортивный Цвет Черный Материал Полиэстер Материал Полиамид Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Доставка Доставка в магазины ROZETKAquery: спортивные шорты женскиеpassage: Спортивные шорты женские ISSA PLUS 7770 L Черные (issa2000260293349) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Длина Удлинённая Страна регистрации бренда Украина Страна-производитель товара Украина Размер L Стиль Спортивный Цвет Черный Материал Полиэстер Тип гарантийного талона Гарантия по чеку Доставка Premium Принт Надпись Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
rusisms_uk
- Dataset: rusisms_uk
- Size: 1,061 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 9 tokens
- mean: 11.14 tokens
- max: 15 tokens
 - min: 18 tokens
- mean: 107.85 tokens
- max: 366 tokens
 
- Samples:query text query: блок безперебійного пітаніяpassage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Джерела безперебійного живлення LogicPower Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 10 ТЕГИ У кредитquery: блок безперебійного пітаніяpassage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 20 ТЕГИ У кредитquery: блок безперебійного пітаніяpassage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Особливості З дисплеєм Час роботи за повного навантаження, хв 8 ТЕГИ У кредит Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
rusisms_ru
- Dataset: rusisms_ru
- Size: 1,061 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 9 tokens
- mean: 11.14 tokens
- max: 15 tokens
 - min: 20 tokens
- mean: 104.92 tokens
- max: 343 tokens
 
- Samples:query text query: блок безперебійного пітаніяpassage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Источники бесперебойного питания LogicPower Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 10 ТЕГИ В кредитquery: блок безперебійного пітаніяpassage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 20 ТЕГИ В кредитquery: блок безперебійного пітаніяpassage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Особенности С дисплеем Время работы при полной нагрузке, мин 8 ТЕГИ В кредит Доставка Доставка в магазины ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
jargonisms_uk
- Dataset: jargonisms_uk
- Size: 338 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 338 samples:query text type string string details - min: 7 tokens
- mean: 11.42 tokens
- max: 18 tokens
 - min: 31 tokens
- mean: 138.73 tokens
- max: 503 tokens
 
- Samples:query text query: сумка для лептопаpassage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки та чохли для ноутбуків 2E Гарантія 14 днів Діагональ ноутбука 15.6"-16" Матеріал Нейлон Колір Grey Тип Сумка Спосіб закриття Змійка Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Китай Діагональ сумки/рюкзака 15.6" Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Особливості Відділення для аксесуарівquery: аккумуляторкаpassage: Акумуляторна ланцюгова пила Greenworks G24CS25 (2000007) Акумуляторні пилки Greenworks Гарантія 36 місяців Кількість вантажних місць 1 Країна реєстрації бренда США Країна-виробник товару Китай Теги недорогі Теги туристичні Теги професійні Для прив'язки тегів Неймовірно тихий Для прив'язки тегів Потужний двигун Для прив'язки тегів Швидкий запуск Довжина шини, мм 250 Особливості Автоматичне змащування ланцюга Особливості Блокування кнопки увімкнення Вага, кг 2.7 Розташування двигуна в пилі Поперечний (бічний) Швидкість обертання ланцюга, м/сек 4.2 Тип гарантійного талона Гарантійний талон магазина Доставка Premium Напруга акумулятора, В 24 Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKAquery: аккумуляторкаpassage: Акумуляторна ланцюгова пила Stark BCS-3610 (310100101) Акумуляторні пилки Stark Гарантія 12 місяців Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Країна-виробник товару Китай Теги недорогі Теги туристичні Довжина шини, мм 250 Особливості SDS система Особливості Гальмо ланцюга Особливості Блокування кнопки увімкнення Особливості Легкий запуск Особливості Автоматичне змащування ланцюга Вага, кг 3.2 Розташування двигуна в пилі Поперечний (бічний) Тип гарантійного талона Гарантійний талон магазина Тип двигуна Безщітковий Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
jargonisms_ru
- Dataset: jargonisms_ru
- Size: 338 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 338 samples:query text type string string details - min: 7 tokens
- mean: 11.42 tokens
- max: 18 tokens
 - min: 28 tokens
- mean: 133.38 tokens
- max: 468 tokens
 
- Samples:query text query: сумка для лептопаpassage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки и чехлы для ноутбуков 2E Гарантия 14 дней Диагональ ноутбука 15.6"-16" Материал Нейлон Цвет Grey Тип Сумка Способ закрытия Молния Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Китай Диагональ сумки/рюкзака 15.6" Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Особенности Отделение для аксессуаровquery: аккумуляторкаpassage: Аккумуляторная цепная пила Greenworks G24CS25 (2000007) Аккумуляторные пилы Greenworks Гарантия 36 месяцев Количество грузовых мест 1 Страна регистрации бренда США Страна-производитель товара Китай Теги недорогие Теги туристические Теги профессиональные Для привязки тегов Невероятно тихий Для привязки тегов Мощный двигатель Для привязки тегов Быстрый запуск Длина шины, мм 250 Особенности Автоматическая смазка цепи Особенности Блокировка кнопки включения Вес, кг 2.7 Расположение двигателя в пиле Поперечное (боковое) Скорость вращения цепи, м/сек 4.2 Тип гарантийного талона Гарантийный талон магазина Доставка Premium Напряжение аккумулятора, В 24 Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKAquery: аккумуляторкаpassage: Аккумуляторная цепная пила Stark BCS-3610 (310100101) Аккумуляторные пилы Stark Гарантия 12 месяцев Количество грузовых мест 1 Страна регистрации бренда Германия Страна-производитель товара Китай Теги недорогие Теги туристические Длина шины, мм 250 Особенности SDS система Особенности Тормоз цепи Особенности Блокировка кнопки включения Особенности Легкий запуск Особенности Автоматическая смазка цепи Вес, кг 3.2 Расположение двигателя в пиле Поперечное (боковое) Тип гарантийного талона Гарантийный талон магазина Тип двигателя Бесщеточный Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
vespa_uk
- Dataset: vespa_uk
- Size: 5,315 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 7 tokens
- mean: 9.58 tokens
- max: 22 tokens
 - min: 19 tokens
- mean: 89.9 tokens
- max: 239 tokens
 
- Samples:query text query: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: Перехідники для шлангу басейну Intex з 32 мм на 38 мм (IP-175136) Обладнання для басейнів Intex Вид Комплектувальніquery: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: З'єднання для шланга Peraqua діаметр 32 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнівquery: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: З'єднання для шлангу Peraqua діаметр 32/38 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
vespa_ru
- Dataset: vespa_ru
- Size: 5,315 evaluation samples
- Columns: queryandtext
- Approximate statistics based on the first 1000 samples:query text type string string details - min: 7 tokens
- mean: 9.58 tokens
- max: 22 tokens
 - min: 20 tokens
- mean: 87.33 tokens
- max: 232 tokens
 
- Samples:query text query: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: Переходники для шланга бассейна Intex с 32 мм на 38 мм (IP-175136) Оборудование для бассейнов Intex Вид Комплектующиеquery: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: Соединение для шланга Peraqua диаметр 32 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейновquery: шланга диаметром 32 мм для викачки брудної води з басейнуpassage: Соединение для шланга Peraqua диаметр 32/38 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов
- Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLosswith these parameters:{ "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 }
Training Hyperparameters
Non-Default Hyperparameters
- eval_strategy: steps
- per_device_train_batch_size: 80
- per_device_eval_batch_size: 16
- learning_rate: 2e-05
- num_train_epochs: 1.0
- warmup_ratio: 0.1
- bf16: True
- bf16_full_eval: True
- tf32: True
- dataloader_num_workers: 4
- load_best_model_at_end: True
- optim: adafactor
- push_to_hub: True
- hub_model_id: yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach
- hub_private_repo: True
- prompts: {'query': 'query: ', 'text': 'passage: '}
- batch_sampler: no_duplicates
All Hyperparameters
Click to expand
- overwrite_output_dir: False
- do_predict: False
- eval_strategy: steps
- prediction_loss_only: True
- per_device_train_batch_size: 80
- per_device_eval_batch_size: 16
- per_gpu_train_batch_size: None
- per_gpu_eval_batch_size: None
- gradient_accumulation_steps: 1
- eval_accumulation_steps: None
- torch_empty_cache_steps: None
- learning_rate: 2e-05
- weight_decay: 0.0
- adam_beta1: 0.9
- adam_beta2: 0.999
- adam_epsilon: 1e-08
- max_grad_norm: 1.0
- num_train_epochs: 1.0
- max_steps: -1
- lr_scheduler_type: linear
- lr_scheduler_kwargs: {}
- warmup_ratio: 0.1
- warmup_steps: 0
- log_level: passive
- log_level_replica: warning
- log_on_each_node: True
- logging_nan_inf_filter: True
- save_safetensors: True
- save_on_each_node: False
- save_only_model: False
- restore_callback_states_from_checkpoint: False
- no_cuda: False
- use_cpu: False
- use_mps_device: False
- seed: 42
- data_seed: None
- jit_mode_eval: False
- use_ipex: False
- bf16: True
- fp16: False
- fp16_opt_level: O1
- half_precision_backend: auto
- bf16_full_eval: True
- fp16_full_eval: False
- tf32: True
- local_rank: 0
- ddp_backend: None
- tpu_num_cores: None
- tpu_metrics_debug: False
- debug: []
- dataloader_drop_last: True
- dataloader_num_workers: 4
- dataloader_prefetch_factor: None
- past_index: -1
- disable_tqdm: False
- remove_unused_columns: True
- label_names: None
- load_best_model_at_end: True
- ignore_data_skip: False
- fsdp: []
- fsdp_min_num_params: 0
- fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- fsdp_transformer_layer_cls_to_wrap: None
- accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- deepspeed: None
- label_smoothing_factor: 0.0
- optim: adafactor
- optim_args: None
- adafactor: False
- group_by_length: False
- length_column_name: length
- ddp_find_unused_parameters: None
- ddp_bucket_cap_mb: None
- ddp_broadcast_buffers: False
- dataloader_pin_memory: True
- dataloader_persistent_workers: False
- skip_memory_metrics: True
- use_legacy_prediction_loop: False
- push_to_hub: True
- resume_from_checkpoint: None
- hub_model_id: yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach
- hub_strategy: every_save
- hub_private_repo: True
- hub_always_push: False
- gradient_checkpointing: False
- gradient_checkpointing_kwargs: None
- include_inputs_for_metrics: False
- include_for_metrics: []
- eval_do_concat_batches: True
- fp16_backend: auto
- push_to_hub_model_id: None
- push_to_hub_organization: None
- mp_parameters:
- auto_find_batch_size: False
- full_determinism: False
- torchdynamo: None
- ray_scope: last
- ddp_timeout: 1800
- torch_compile: False
- torch_compile_backend: None
- torch_compile_mode: None
- dispatch_batches: None
- split_batches: None
- include_tokens_per_second: False
- include_num_input_tokens_seen: False
- neftune_noise_alpha: None
- optim_target_modules: None
- batch_eval_metrics: False
- eval_on_start: False
- use_liger_kernel: False
- eval_use_gather_object: False
- average_tokens_across_devices: False
- prompts: {'query': 'query: ', 'text': 'passage: '}
- batch_sampler: no_duplicates
- multi_dataset_batch_sampler: proportional
- ddp_static_graph: False
- ddp_comm_hook: bf16
- gradient_as_bucket_view: False
- num_proc: 30
Training Logs
| Epoch | Step | Training Loss | core uk loss | core ru loss | typos uk loss | typos ru loss | transliterations uk loss | transliterations ru loss | options uk loss | options ru loss | rusisms uk loss | rusisms ru loss | jargonisms uk loss | jargonisms ru loss | vespa uk loss | vespa ru loss | test-core-uk--matryoshka_dim-768--_dot_ndcg_10 | test-core-ru--matryoshka_dim-768--_dot_ndcg_10 | typos-uk--matryoshka_dim-768--_dot_ndcg_10 | typos-ru--matryoshka_dim-768--_dot_ndcg_10 | transliterations-uk--matryoshka_dim-768--_dot_ndcg_10 | transliterations-ru--matryoshka_dim-768--_dot_ndcg_10 | options-uk--matryoshka_dim-768--_dot_ndcg_10 | options-ru--matryoshka_dim-768--_dot_ndcg_10 | rusisms-uk--matryoshka_dim-768--_dot_ndcg_10 | rusisms-ru--matryoshka_dim-768--_dot_ndcg_10 | test-jargonisms-uk--matryoshka_dim-768--_dot_ndcg_10 | test-jargonisms-ru--matryoshka_dim-768--_dot_ndcg_10 | vespa-uk--matryoshka_dim-768--_dot_ndcg_10 | vespa-ru--matryoshka_dim-768--_dot_ndcg_10 | 
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0.0050 | 791 | 4.2875 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0100 | 1582 | 4.0854 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0150 | 2373 | 3.6173 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0200 | 3164 | 2.9035 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0250 | 3955 | 2.0941 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0300 | 4746 | 1.7178 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0350 | 5537 | 1.633 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0400 | 6328 | 1.4813 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0450 | 7119 | 1.3263 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.05 | 7907 | - | 0.6864 | 0.6294 | 0.6578 | 0.7209 | 1.5118 | 1.4681 | 0.8203 | 0.6540 | 0.5308 | 0.6432 | 0.7704 | 1.5918 | 0.5597 | 0.6601 | 0.5816 | 0.5733 | 0.5305 | 0.5268 | 0.4486 | 0.4590 | 0.5466 | 0.5369 | 0.7887 | 0.7986 | 0.7449 | 0.7367 | 0.7797 | 0.7636 | 
| 0.0500 | 7910 | 1.3341 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0550 | 8701 | 1.1477 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0600 | 9492 | 1.1108 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0650 | 10283 | 1.0593 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0700 | 11074 | 1.0071 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0750 | 11865 | 0.983 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0800 | 12656 | 0.8944 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0850 | 13447 | 0.8962 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0900 | 14238 | 0.8461 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.0950 | 15029 | 0.7794 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1 | 15814 | - | 0.4231 | 0.4040 | 0.4953 | 0.5252 | 1.3402 | 1.3510 | 0.5112 | 0.6594 | 0.3408 | 0.2651 | 0.8411 | 0.4260 | 0.3287 | 0.3096 | 0.5955 | 0.5920 | 0.5514 | 0.5424 | 0.4686 | 0.4757 | 0.5612 | 0.5540 | 0.8266 | 0.8256 | 0.7414 | 0.7422 | 0.7830 | 0.7774 | 
| 0.1000 | 15820 | 0.7825 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1050 | 16611 | 0.7571 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1100 | 17402 | 0.7322 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1150 | 18193 | 0.7172 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1200 | 18984 | 0.7028 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1250 | 19775 | 0.7024 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1300 | 20566 | 0.6688 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1351 | 21357 | 0.6408 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1401 | 22148 | 0.6299 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1451 | 22939 | 0.6077 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.15 | 23721 | - | 0.3401 | 0.3455 | 0.4534 | 0.4498 | 1.2558 | 1.2689 | 0.4413 | 0.3933 | 0.2799 | 0.2071 | 0.3209 | 0.3756 | 0.2587 | 0.2515 | 0.5978 | 0.5941 | 0.5555 | 0.5479 | 0.4679 | 0.4743 | 0.5721 | 0.5669 | 0.8177 | 0.8190 | 0.7456 | 0.7587 | 0.7894 | 0.7812 | 
| 0.1501 | 23730 | 0.604 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1551 | 24521 | 0.6272 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1601 | 25312 | 0.5768 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1651 | 26103 | 0.5699 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1701 | 26894 | 0.5542 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1751 | 27685 | 0.5503 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1801 | 28476 | 0.5524 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1851 | 29267 | 0.5424 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1901 | 30058 | 0.5238 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.1951 | 30849 | 0.5418 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2 | 31628 | - | 0.2773 | 0.2884 | 0.3668 | 0.3492 | 1.2221 | 1.1874 | 0.4122 | 0.4389 | 0.2193 | 0.2667 | 0.2431 | 0.4595 | 0.2278 | 0.2324 | 0.5961 | 0.5952 | 0.5575 | 0.5499 | 0.4712 | 0.4752 | 0.5726 | 0.5669 | 0.8267 | 0.8228 | 0.7533 | 0.7598 | 0.7899 | 0.7849 | 
| 0.2001 | 31640 | 0.5181 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2051 | 32431 | 0.5116 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2101 | 33222 | 0.4928 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2151 | 34013 | 0.5228 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2201 | 34804 | 0.5071 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2251 | 35595 | 0.5006 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2301 | 36386 | 0.4802 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2351 | 37177 | 0.464 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2401 | 37968 | 0.4752 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2451 | 38759 | 0.4719 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.25 | 39535 | - | 0.2823 | 0.2975 | 0.3885 | 0.3945 | 1.1898 | 1.1150 | 0.4622 | 0.3916 | 0.1848 | 0.2463 | 0.4574 | 0.4815 | 0.2194 | 0.2514 | 0.5978 | 0.5938 | 0.5559 | 0.5495 | 0.4731 | 0.4778 | 0.5722 | 0.5688 | 0.8231 | 0.8195 | 0.7488 | 0.7539 | 0.7874 | 0.7820 | 
| 0.2501 | 39550 | 0.4816 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2551 | 40341 | 0.4838 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2601 | 41132 | 0.4726 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2651 | 41923 | 0.4741 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2701 | 42714 | 0.4486 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2751 | 43505 | 0.4783 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2801 | 44296 | 0.4656 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2851 | 45087 | 0.4526 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2901 | 45878 | 0.4583 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.2951 | 46669 | 0.4659 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3 | 47442 | - | 0.2731 | 0.2857 | 0.3243 | 0.4003 | 1.1616 | 1.1314 | 0.4140 | 0.4132 | 0.2176 | 0.1832 | 0.5629 | 0.3869 | 0.2059 | 0.2369 | 0.5960 | 0.5952 | 0.5581 | 0.5508 | 0.4749 | 0.4789 | 0.5739 | 0.5725 | 0.8248 | 0.8212 | 0.7526 | 0.7485 | 0.7942 | 0.7869 | 
| 0.3001 | 47460 | 0.4584 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3051 | 48251 | 0.4462 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3101 | 49042 | 0.4492 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3151 | 49833 | 0.4334 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3201 | 50624 | 0.4468 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3251 | 51415 | 0.4277 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3301 | 52206 | 0.4605 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3351 | 52997 | 0.4523 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3401 | 53788 | 0.4642 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.3451 | 54579 | 0.4244 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | 
| 0.35 | 55349 | - | 0.2588 | 0.2903 | 0.3666 | 0.3502 | 1.1220 | 1.1029 | 0.4220 | 0.4102 | 0.1680 | 0.1905 | 0.2735 | 0.1803 | 0.1954 | 0.2161 | 0.5967 | 0.5962 | 0.5591 | 0.5529 | 0.4768 | 0.4802 | 0.5786 | 0.5739 | 0.8232 | 0.8205 | 0.7656 | 0.7538 | 0.7983 | 0.7857 | 
Framework Versions
- Python: 3.11.10
- Sentence Transformers: 3.3.0
- Transformers: 4.46.3
- PyTorch: 2.5.1+cu124
- Accelerate: 1.1.1
- Datasets: 3.1.0
- Tokenizers: 0.20.3
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
- Downloads last month
- -
Model tree for yklymchuk-rztk/multilingual-e5-base-matryoshka2d-cached-mnr-multiple-datasets-large-2-4-pekach
Base model
intfloat/multilingual-e5-baseEvaluation results
- Dot Accuracy 10 on test core uk matryoshka dim 768self-reported0.992
- Dot Precision 10 on test core uk matryoshka dim 768self-reported0.402
- Dot Recall 10 on test core uk matryoshka dim 768self-reported0.478
- Dot Ndcg 10 on test core uk matryoshka dim 768self-reported0.597
- Dot Mrr 10 on test core uk matryoshka dim 768self-reported0.887
- Dot Map 60 on test core uk matryoshka dim 768self-reported0.429
- Dot Accuracy 10 on test core ru matryoshka dim 768self-reported0.992
- Dot Precision 10 on test core ru matryoshka dim 768self-reported0.401
- Dot Recall 10 on test core ru matryoshka dim 768self-reported0.478
- Dot Ndcg 10 on test core ru matryoshka dim 768self-reported0.596