Sentence Similarity
sentence-transformers
Safetensors
Catalan
Spanish
English
roberta
feature-extraction
Generated from Trainer
dataset_size:65360
loss:ContrastiveLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use langtech-innovation/mRoBERTA_retrieval with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use langtech-innovation/mRoBERTA_retrieval with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("langtech-innovation/mRoBERTA_retrieval") sentences = [ "El agua se volvió turbia desde que uso el ozono. ¿A qué se debe?", "27 de septiembre de 2009 27 de septiembre de 2009Tegucigalpa, Honduras — En un comunicado del gobierno de facto hondureño, encabezado por Roberto Micheletti, se ha decretado un ultimatum de 10 días para que la embajada de Brasil defina el estatus del depuesto presidente Manuel Zelaya, quien permanece en la sede diplomática desde el lunes pasado. En el texto del comunicado se afirma: \"ningún país puede tolerar que una embajada extranjera sea utilizada como base de mando para generar violencia y romper la tranquilidad, como el señor Zelaya lo ha estado haciendo desde su ingreso al territorio nacional\", agregando: \"nos veremos obligados a tomar medidas adicionales conforme al derecho internacional\".", "La nubosidad es una señal de que el ozono está haciendo su trabajo. Continúe ejecutando el filtro y desaparecerá en un par de días. La nubosidad también puede indicar un problema en el filtro. Verifique el filtro por daños y operación apropiada. Retrolavado si es necesario.", "El filòsof i periodista Jordi Graupera ha guanyat la votació de Primàries Catalunya a Barcelona, amb 7.715 vots. El segon candidat més votat ha estat Adrià Alsina, ex-membre del secretariat de l'ANC, amb 1.933 vots. La votació va començar divendres a les 20.00 i s'ha acabat avui a les 20.00." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
| { | |
| "_name_or_path": "BSC-LT/mRoBERTa", | |
| "architectures": [ | |
| "RobertaModel" | |
| ], | |
| "attention_probs_dropout_prob": 0.1, | |
| "bos_token_id": 0, | |
| "classifier_dropout": null, | |
| "eos_token_id": 2, | |
| "hidden_act": "gelu", | |
| "hidden_dropout_prob": 0.1, | |
| "hidden_size": 768, | |
| "initializer_range": 0.02, | |
| "intermediate_size": 3072, | |
| "layer_norm_eps": 1e-05, | |
| "max_position_embeddings": 514, | |
| "model_type": "roberta", | |
| "num_attention_heads": 12, | |
| "num_hidden_layers": 12, | |
| "pad_token_id": 1, | |
| "position_embedding_type": "absolute", | |
| "torch_dtype": "float32", | |
| "transformers_version": "4.49.0", | |
| "type_vocab_size": 1, | |
| "use_cache": true, | |
| "vocab_size": 256000 | |
| } | |