SentenceTransformer based on Alibaba-NLP/gte-multilingual-base

This is a sentence-transformers model finetuned from Alibaba-NLP/gte-multilingual-base on the parquet dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: Alibaba-NLP/gte-multilingual-base
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • parquet

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'NewModel'})
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'PROCURADORIA GERAL DO ESTADO DO RIO DE JANEIRO \nPROCURADORIA DE SERVIÇOS DE SAÚDE (PG-16) \n \nEXMO. SR. DR. DES. 3º PRESIDENTE DO TRIBUNAL DE JUSTIÇA DO RIO DE \nJANEIRO \n \n \n \nProcesso 0076107-19.2019.8.19.0001 \n \n \n \nO\n ESTADO DO RIO DE JANEIRO, \npela Procuradoria Geral do Estado, \nnos autos do recurso extraordinário interposto por \nPERCEDINA DOS SANTOS TORRES e \noutro\n,\n \nvem, tempestivamente, apresentar suas \n \n \nCONTRARRAZÕES DE RECURSO EXTRAORDINÁRIO \n \n \npelos fundamentos jurídicos expostos na peça em anexo, esperando, desde já, pelo não \nconhecimento ou pelo desprovimento do recurso, como de Direito. \n \nPede deferimento. \nRio de Janeiro, 26 de janeiro de 2021.  \n \n \n \nLETICIA LACROIX DE OLIVEIRA \nP\nROCURADORA DO \nE\nSTADO\n \n \n \n \n \n \n \nTJRJ 202100041683 27/01/2021 00:06:00 GPLI - PETIÇÃO ELETRÔNICA Assinada por LETICIA LACROIX DE OLIVEIRA\n373\nDigitally signed by LETICIA LACROIX DE OLIVEIRA:04296848780\nDate: 2021.01.26 21:23:08 BRST',
    'PROCURADORIA GERAL DO ESTADO DO RIO DE JANEIRO \nPROCURADORIA DE SERVIÇOS DE SAÚDE (PG-16) \n \n \n3 \n \n          Na prática, pode-se concluir que o acórdão recorrido revogou toda a \njurisprudência sumular dos Tribunais Superiores, entendendo ser aplicável um julgado do STF \nque, numa ação rescisória e em caráter incidental, acredita ser cabível o pagamento de \nhonorários advocatícios à Defensoria Pública pelo mesmo ente federado responsável por seu \nfuncionamento. Situação que, \npermissa venia\n, é inadmissível e viola frontalmente o \nordenamento jurídico vigente. \n \n         Uma outra questão jurídica diz respeito à possibilidade de este acórdão do STF, \nque como já se disse, decidiu sobre o tema em caráter incidental e não tem caráter vinculante, \nrevogar a própria Súmula 421 do STJ. Um acórdão que decide um tema de modo incidental \nrevoga automaticamente as Súmulas dos outros Tribunais? \nData venia\n, parece-nos que não.  \n \nII - ILEGALIDADE DO PAGAMENTO DE HONORÁRIOS PELO ESTADO EM \nFAVOR DA DEFENSORIA PÚBLICA – OCORRÊNCIA DA CONFUSÃO (ARTIGO \n381 DO CÓDIGO CIVIL) – TEMA PACIFICADO PELO E. STJ\n \n  \nRememore-se, por oportuno, que já está pacificado na doutrina e na jurisprudência \no entendimento de que há confusão na condenação do Estado ao pagamento de honorários \nsucumbenciais à Defensoria Pública, nos termos do que estabelece o artigo 381 do Código Civil, \nverbis\n: \n \nArt. 381 – Extingue-se a obrigação desde que na mesma pessoa se \nconfundam as qualidades de credor e devedor. \n \nCom efeito, considerando que tanto a Defensoria Pública, quanto o seu Centro de \nEstudos Jurídicos são órgãos do próprio Estado, mostra-se flagrante que o caso é de confusão',
    'Atribuição: Fazenda Pública \nCódigo/Nome Movimento: 1000173/Outras manifestações em 2º grau\n \nrestituição dos valores indevidamente descontados, com atualização e juros, e \napuração em fase de liquidação de sentença.  \n \nInconformada, a parte ré interpôs o recurso de apelação do \nitem 000114. \n \nPetição juntada no item 000122 noticiando o falecimento do \nautor e requerendo sua substituição processual por sua filha, Luciana Maria da Silva \nMirandola. \n \nDespacho no item 000140 determinando a intimação da \nProcuradoria Geral do Município do Rio de Janeiro e do Ministério Público sobre o \npedido de habilitação. \n \nCiência do Parquet no item 000148. \n \nManifestação dos réus no item 000150 requerendo a \ndeclaração de nulidade da sentença e dos atos praticados após o óbito do autor, bem \ncomo a rejeição do pedido de habilitação, uma vez que a sucessão processual deveria \nser pelo espólio, na forma do artigo 110 do CPC. \n \nDespacho no item 000155 para manifestação do Ministério \nPúblico. \n \nCiência do Parquet no item 000161. \n \nDespacho no item 000164 para manifestação da parte autora. \n \n221',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000,  0.6637, -0.0623],
#         [ 0.6637,  1.0000, -0.0069],
#         [-0.0623, -0.0069,  1.0000]])

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.6545
cosine_accuracy@3 0.7925
cosine_accuracy@5 0.841
cosine_accuracy@10 0.89
cosine_precision@1 0.6545
cosine_precision@3 0.5032
cosine_precision@5 0.4011
cosine_precision@10 0.2742
cosine_recall@1 0.2385
cosine_recall@3 0.4422
cosine_recall@5 0.5245
cosine_recall@10 0.6212
cosine_ndcg@10 0.622
cosine_mrr@10 0.7326
cosine_map@100 0.5411

Training Details

Training Dataset

parquet

  • Dataset: parquet
  • Size: 200,000 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 129 tokens
    • mean: 395.23 tokens
    • max: 490 tokens
    • min: 99 tokens
    • mean: 356.9 tokens
    • max: 509 tokens
  • Samples:
    anchor positive
    Doc. 1
    TJRJ CAP 12VFE 202401831853 17/04/24 12:55:57139829 PROGER-VIRTUAL
    54


    Petição Inicial Eletrônica 2ª instância/Conselho da Magistratura

    Srº Usuário, a petição foi encaminhada com sucesso.

    O protocolo gerado é a sua garantia do recebimento da petição pelo Tribunal de Justiça do
    Rio de Janeiro, sendo desnecessário novo peticionamento eletrônico com as mesmas
    informações.

    Dados do Processo
    Processo: 0028612-06.2024.8.19.0000

    Protocolo: 3204/2024.00310040

    Segunda Instância

    Advogado(s)

    RJ144016
    - DANIEL NEVES ROSA DURÃO DE ANDRADE
    RJ152461
    - CAROLINA TEIXEIRA DE SOUSA

    Parte(s)

    PASQUALE MAURO BENF
    , Pessoa Física , CPF - 007.220.147-91 Endereço: Comercial - das Américas, 10333,
    RJ, Rio de Janeiro, Barra da Tijuca, , CEP: 22793082

    Documento(s)
    Data : 16/04/2024
    Horário : 17:55
    Número do Processo de Referência:
    10041723
    Orgão de Origem:
    Capital: Cartório Eletrônico da 12ª Vara de Fazenda Publica
    Natureza:
    Civel
    Tipo Protocolo:
    AGRAVO DE INSTRUMENTO - CÍV...
    3
    5.172/1966 – Código Tributário Nacional – “CTN”, com sua redação anterior à Lei Complementar
    nº 118, de 9 de fevereiro de 2005.

    Em que pese a robusta argumentação contida da referida Exceção, esta foi rejeitada
    por intermédio da r. decisão do indexador nº 28, ora agravada, abaixo transcrita:

    “Reconsidero a decisão retro equivocadamente proferida visto que o executado se encontra
    representado nos autos por advogado.
    Rejeito a arguição de prescrição visto que

    consta do Sistema de Dívida Ativa bem como
    deste E. Tribunal de justiça que o AR para citação do executado retornou com
    resultado positivo
    .
    Lavre-se termo de penhora e intime-se na forma do art. 12 da LEF”. (grifamos)

    Data maxima venia
    , a conclusão exarada pelo MM. Juízo
    a quo
    não observa a legislação
    e jurisprudência relativa ao reconhecimento da prescrição originária e intercorrente, se justificando a
    interposição do presente Agravo de Instrumento com o intuito de obter a reforma da r. decisão
    recorrida...
    TRIBUNAL DE JUSTIÇA DO RIO DE JANEIRO
    eJUD TJRJ
    03/05/2021 06:52
    Emitido em:
    DGJUR - SECRETARIA DA 12ª CÂMARA CÍVEL
    Processo: 0277899-58.2018.8.19.0001 - APELAÇÃO
    INTIMAÇÃO ELETRÔNICA
    Rio de Janeiro, 03 de maio de 2021
    Fica V. Sª / V. Exª intimado da determinação abaixo:
    DÉCIMA SEGUNDA CÂMARA CÍVEL
    DÉCIMA SEGUNDA CÂMARA CÍVEL
    EMBARGOS DE DECLARAÇÃO EM APELAÇÃO CÍVEL Nº 0277899-58.2018.8.19.0001
    EMBARGOS DE
    Embargantes 1: JANE PASQUINELLI E OUTROS.
    Embargantes 1: JANE PASQUINELLI E OUTROS.
    Embargantes 2: PREVI-RIO - INSTITUTO DE PREVIDÊNCIA E ASSISTÊNCIA.
    Embargantes 2: PREVI-RIO
    Embargados: OS MESMOS
    Embargados: OS MESMOS
    Relator: Desembargador JAIME DIAS PINHEIRO FILHO
    Relator: Desembargador JAIME DIAS PINHEIRO
    EMBARGOS DE DECLARAÇÃO OPOSTOS POR AMBAS AS PARTES. EMBARGOS OPOSTOS PELOS
    EMBA
    AUTORES/EMBARGANTES, QUE DEVE SER PROVIDO, COM EFEITOS INFRINGENTES, A FIM DE
    AUTO
    QUE O RÉU REEMBOLSE AOS AUTORES AS CUSTAS E A TAXA JUDICIÁRIA QUE FORAM
    QUE O
    ANTECIPADAS PELOS AUTORES, ANTE O...
    não concorda e deve, por isso, manejar os recursos que entender cabíveis e não insistir na oposição de embargos
    que, em regra, não servem para alterar o julgado, notadamente quando não há omissão, contradição, obscuridade
    ou erro material.
    In casu, o que se extrai dos autos é que os presentes embargos visam, primordialmente, a reforma, bem
    como o prequestionamento da matéria objeto do julgado, conforme consignado em suas razões, ocasião em que a
    recorrente pleiteia, inclusive, a concessão de efeitos infringentes.
    Como é cediço, a modificação do julgado não se insere entre as funções dos embargos de declaração, o que
    só se admite em casos excepcionais, não sendo, pois, esta a hipótese dos autos.
    A propósito, transcrevo trecho do julgamento de Embargos de Declaração, da lavra do eminente Professor e
    Desembargador Sergio Cavalieri Filho:
    "Embargos de Declaração. Omissão Inexistente. Contestação do Julgado. Efeito Modificativo. Prequestionamento.
    Descabimento....
    TRIBUNAL DE JUSTIÇA DO ESTADO DO RIO DE JANEIRO
    eJUD TJRJ
    08/03/2024 12:11
    Emitido em:
    SECRETARIA DA 6ª CÂMARA DE DIREITO PÚBLICO (ANTIGA 21ª CÂMARA CÍVEL)
    Processo: 0297157-30.2013.8.19.0001 - APELAÇÃO
    INTIMAÇÃO ELETRÔNICA
    Rio de Janeiro, 08 de março de 2024
    Fica V. Sª / V. Exª intimado da determinação abaixo:
    Apelação Cível nº 0297157-30.2013.8.19.0001
    Apelante: INSTITUTO DE PREVIDÊNCIA E ASSISTÊNCIA DO MUNICÍPIO DO RIO DE JANEIRO -
    PREVIRIO
    Apelado: MIDAS ENGENHARIA LTDA
    Juízo de Origem: Quinta Vara de Fazenda Pública da Comarca da Capital
    Relatora: Desembargadora LIDIA MARIA SODRÉ DE MORAES
    APELAÇÃO CÍVEL. DIREITO ADMINISTRATIVO. AÇÃO DE OBRIGAÇÃO DE FAZER. PRESTAÇÃO DE
    SERVIÇO. ALEGAÇÃO AUTORAL DE INEXECUÇÃO PARCIAL DO CONTRATO DE PRESTAÇÃO DE
    SERVIÇOS COM EXECUÇÃO DE OBRAS DO SISTEMA DE AR-CONDICIONADO NOS BLOCOS I E II
    DO CENTRO ADMINISTRATIVO SÃO SEBASTIÃO. SENTENÇA QUE JULGOU IMPROCEDENTE O
    PEDIDO. IRRESIGNAÇÃO DO INSTITUTO DE PREVIDÊNCIA REPRISANDO AS ARGUMENTAÇÕES
    APRESENTA...
    Requereu a procedência do pedido para a condenação da ré na obrigação de fazer consistente na adequada
    instalação do sistema de automação e "telesupervisão" do ar condicionado, ou subsidiariamente, a conversão em
    perdas e danos, desde, 26/06/2008, término do prazo para cumprimento do contrato, e ao pagamento
    de danos materiais relativo aos juros compensatórios e de mora, com correção monetária, desde o
    desembolso e de acordo com as taxas contratualmente previstas, em razão do inadimplemento parcial do
    contrato.
    Adoto, no mais, o relatório constante da sentença, na forma regimental.
    Prestação jurisdicional através da prolação da sentença de índice 430, que julgou improcedente o pedido,
    cuja parte dispositiva, reza o seguinte:
    "...Isto posto, julgo improcedentes os pedidos, e, em consequência, extinto o processo com julgamento do mérito,
    na forma do artigo 487, I, do Código de Processo Civil.
    Condeno a parte autora ao ...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false
    }
    

Evaluation Dataset

parquet

  • Dataset: parquet
  • Size: 2,000 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 112 tokens
    • mean: 392.22 tokens
    • max: 536 tokens
    • min: 98 tokens
    • mean: 354.08 tokens
    • max: 555 tokens
  • Samples:
    anchor positive
    EXCELENTÍSSIMA. DRA. DESEMBARGADORA-RELATORA DA QUINTA
    CÂMARA DE DIREITO PÚBLICO DO TRIBUNAL DE JUSTIÇA DO ESTADO DO
    RIO DE JANEIRO.

    Apelação Cível nº 0145575-65.2022.8.19.0001




    SUZANA DE FÁTIMA DE SOUZA SILVA,
    embargante já
    devidamente qualificada nos autos do processo acima epigrafado,
    VEM

    tempestivamente no quinquídio legal, e respeitosamente à presença de Vossa
    Excelência, nos termos do art. 1.022, 1023 e 1.025 do Novo CPC, opor

    EMBARGOS DE DECLARAÇÃO
    COM EFEITOS DE PREQUESTIONAMENTO E SUPERAÇÃO DE OMISSÃO
    (SÚMULAS 98 E 211 DO STJ)


    em face da decisão do acórdão proferido nos presentes autos em
    epígrafe, que improveu a apelação das embargantes, para suprir pontos
    contraditórios, proferido nos presentes autos em epígrafe, e a inda clarear
    obscuridade, e afastar omissões, que eventualmente se registrem no V. Acórdão,
    com base nos seguintes fundamentos fáticos e jurídicos a serem expostos a seguir:

    Nesse passo, e por isso, no entender da embargante, há...
    Escolar; Dar banho e trocar o vestuário das crianças da
    creche; Auxiliar na orientação das crianças no recreio
    e nos intervalos, objetivando manter a segurança e a
    disciplina; Participar de todas as aulas prestando
    todos os cuidados devido às crianças; Organizar o
    ambiente e orientar as crianças para o repouso,
    permanecendo com elas durante todo o tempo que
    estiverem
    dormindo;
    Responsabilizar-se
    pelas
    crianças que aguardam os pais ou o transporte escolar
    até a sua efetiva entrega, zelando pela segurança e
    bem estar de todos; Responsabilizar-se pela limpeza e
    desinfecção de brinquedos e equipamentos utilizados
    pelas crianças; Participar de todas as atividades
    576
    TRIBUNAL DE JUSTIÇA DO RIO DE JANEIRO
    eJUD TJRJ
    03/08/2021 14:39
    Emitido em:
    DGJUR - SECRETARIA DA 22ª CÂMARA CÍVEL
    Processo: 0232479-93.2019.8.19.0001 - APELAÇÃO
    INTIMAÇÃO ELETRÔNICA
    Rio de Janeiro, 03 de agosto de 2021
    Fica V. Sª / V. Exª intimado da determinação abaixo:
    VIGÉSIMA SEGUNDA CÂMARA CÍVEL
    APELAÇÃO CÍVEL Nº 0232479-93.2019.8.19.0001
    APELANTE 1: MUNICÍPIO DO RIO DE JANEIRO
    PROC. MUNICIPAL: LEO BOSCO GRIGGI PEDROSA
    APELANTE 2 : ESTADO DO RIO DE JANEIRO
    PROC. DO ESTADO: ANA CRISTINA BACOS
    APELADO : ASSOCIAÇÃO LAR SÃO FRANCISCO DE ASSIS NA PROVIDÊNCIA DE DEUS
    ADVOGADO : PAMELA GUIMARÃES TEIXEIRA LIMA
    RELATOR: DES. BENEDICTO ABICAIR
    APELAÇÃO CÍVEL. ÇÃO DE COBRANÇA PROPOSTA POR HOSPITAL DA REDE PRIVADA EM FACE
    DO ESTADO DO RIO DE JANEIRO E DO MUNICÍPIO DO RIO DE JANEIRO. DESPESAS DECORRENTES
    DE INTERNAÇÃO E TRATAMENTO DE PACIENTE IMPOSTA POR DECISÃO JUDICIAL. OBRIGAÇÃO
    SOLIDÁRIA DOS ENTES PÚBLICOS QUANTO À COBERTURA DOS CUSTOS DO TRATAMENTO.
    ILEGITIMIDADE PASSIVA QUE SE AF...
    VEREDA, A PRESTAÇÃO DO SERVIÇO MÉDICO-HOSPITALAR PELO AUTOR DECORREU DA
    OMISSÃO DO PODER PÚBLICO EM CUMPRIR COM O SEU DEVER CONSTITUCIONAL,
    CABENDO-LHE, POR CONSEGUINTE, RESSARCIR OS GASTOS SUPORTADOS PELO HOSPITAL
    PARTICULAR. NO QUE SE REFERE À LIMITAÇÃO DO RESSARCIMENTO À TABELA DO SISTEMA
    ÚNICO DE SAÚDE, O INTENTO RECURSAL NÃO MERECE PROSPERAR, NA MEDIDA EM QUE O
    HOSPITAL AUTOR NÃO POSSUI CONVÊNIO COM O SUS. POR OUTRO LADO, NÃO SE MOSTRA
    RAZOÁVEL EXIGIR QUE HOSPITAL PARTICULAR SUPORTE OS GASTOS, AINDA QUE
    PARCIALMENTE, PARA INTERNAÇÃO E TRATAMENTO DE ADMINISTRADO EM RAZÃO DA
    OMISSÃO DO ENTE PÚBLICO E EM DECORRÊNCIA DE DECISÃO JUDICIAL. DESPROVIMENTO DOS
    RECURSOS. SENTENÇA MANTIDA
    0140919-75.2016.8.19.0001 - Apelação - Relator: Des(a). MÔNICA DE FARIA SARDAS - Data de Julgamento:
    06/08/2020, VIGÉSIMA CÂMARA CÍVEL
    APELAÇÃO CÍVEL. AÇÃO DE COBRANÇA PROPOSTA POR HOSPITAL DA REDE PRIVADA EM FACE
    DO ESTADO DO RIO DE JANEIRO E DO MUNICÍPIO DO RIO DE JANEIRO. DESPESAS DECORRENTES
    274
    Praça Floriano, n. 55, sala 409 – Cinelândia - Centro. Rio de Janeiro – RJ. Brasil. CEP: 20.031-050.
    Tel: (21) 2533-6008 [email protected] www.simonatopessoa.adv.br

    EXCELENTÍSSIMO SENHOR DOUTOR DESEMBARGADOR TERCEIRO
    VICE-PRESIDENTE EDSON VASCONCELOS DO TRIBUNAL DE JUSTIÇA
    DO ESTADO DO RIO DE JANEIRO.

    RECURSO ESPECIAL Nº 0466091-77.2015.8.19.0001

    Relator:
    DES. MARCOS ANDRÉ CHUT
    Apelante:
    INSTITUTO SAO JOAO BATISTA LTDA - ISJOB
    Apelado:
    MUNICÍPIO DO RIO DE JANEIRO

    GRATUIDADE DE JUSTIÇA





    INSTITUTO SÃO JOÃO BAPTISTA LTDA – ISJOB
    , com sede na Rua
    Medina, 246, Méier, Rio de Janeiro – RJ. CEP: 20.735-130, inscrito no CNPJ/MF
    sob nº 33.666.306/0001-30, nos autos do recurso de
    Apelação
    em epigrafe que
    move em face do
    MUNICÍPIO DO RIO DE JANEIRO
    , por seu advogado, vem
    respeitosamente à presença de Vossa Excelência, inconformado com a decisão
    que inadmitiu o
    RECUSOS ESPECIAL
    , da lavra do Ilustre Desembargador
    Terceiro Vice-Presi...
    Praça Floriano, n. 55, sala 409 – Cinelândia - Centro. Rio de Janeiro – RJ. Brasil. CEP: 20.031-050.
    Tel: (21) 2533-6008 [email protected] www.simonatopessoa.adv.br

    69. Assim, a partir do confronto destas datas não restam dúvidas de que as
    obrigações em questão já se encontravam extintas.

    70. Neste sentido, resta evidente que a cobrança dos créditos tributários ora
    contestados, encontra-se prescrita nos termos do caput do artigo 174 do
    Código Tributário Nacional – CTN conforme o entendimento já
    consolidado pelo Superior Tribunal de Justiça, conforme ementa abaixo
    transcrita:

    “0010513-72.2004.8.19.0037 - APELACAO

    1ª Ementa
    DES. JACQUELINE MONTENEGRO - Julgamento: 15/10/2015 - DECIMA
    QUINTA CAMARA CIVEL

    APELAÇÃO CÍVEL. PROCESSUAL CIVIL. EXECUÇÃO FISCAL. IMPOSTO
    SOBRE PROPRIEDADE TERRITORIAL URBANA ¿ IPTU, TAXA DE
    SERVIÇOS URBANOS ¿ TSU E TAXA DE COLETA DE LIXO DOMICILIAR ¿
    TCDL DOS EXERCÍCIOS DE 1999 A 2003. MANDADO DE CITAÇÃO EM
    EXEC...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim",
        "gather_across_devices": false
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • gradient_accumulation_steps: 4
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • bf16: True
  • optim: adamw_8bit
  • gradient_checkpointing: True
  • eval_on_start: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 4
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_8bit
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: True
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: True
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss Validation Loss cosine_ndcg@10
0 0 - 2.9505 0.1959
0.1011 79 1.7256 0.8699 0.4472
0.2022 158 0.8044 0.6145 0.5072
0.3034 237 0.6254 0.5068 0.5353
0.4045 316 0.5215 0.4230 0.5725
0.5056 395 0.4507 0.3787 0.5906
0.6067 474 0.4014 0.3429 0.6014
0.7078 553 0.3779 0.3279 0.6129
0.8090 632 0.3463 0.3099 0.6223
0.9101 711 0.3202 0.2974 0.6220

Framework Versions

  • Python: 3.12.11
  • Sentence Transformers: 5.1.2
  • Transformers: 4.57.0.dev0
  • PyTorch: 2.9.0+cu128
  • Accelerate: 1.11.0
  • Datasets: 4.3.0
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
123
Safetensors
Model size
0.3B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for LAMDEC/gte-pgm-pairs

Finetuned
(91)
this model

Evaluation results