SentenceTransformer based on Omartificial-Intelligence-Space/GATE-AraBert-v1

This is a sentence-transformers model finetuned from Omartificial-Intelligence-Space/GATE-AraBert-v1. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'ما هي حقوق المدعية إذا انخفضت المبيعات بسبب سياسة المدعى عليها؟',
    '[السياق: يوضح هذا الجزء رد المدعية على اعتراض المدعى عليها على تقرير الخبير وتأكيد أحقيتها في المطالبة. وقررت المحكمة متابعة النظر في الدعوى.]  \n(اعتراض على ما تقدم به الخبير في تقريره أبين ما يلي: أولا: في المستهل العقد بدأ في تاريخ ٩/٤/٢٠١٧م الموافق ١٢/٧/١٤٣٨ هـ وانتهى التعاقد تاريخ 31/7/٢٠١٨م الموافق 18/١١/١٤٣٩هـ ثانيا: جاء التقرير متفقا مع ما ادعى به المدعي دون النظر لما لدى موكلتي. ثالثا : إن نقطة التعادل هي٩٢٠٠ النقطة التي في حال بلغت المبيعات أكثر منها فإنه يكون هناك تحصيل لصالح موكلتي بنسبة 7% منه أما في حال كان أقل فإن موكلتي لا تحصلها ، بشرط أن لا يكون سبب تراجع المبيعات عن هذه النسبة بسبب إهمال المدعي وإلا كان تحصيلها حقا لموكلتي . رابعا: ما اعتمد عليه الخبير في تقريره جدول مرسل من المدعي ومن إعداده حيث إن ادعاء المدعي تسليم موكلتي مبلغ 46853 ريالا وهذا الأمر غير صحيح لم تستلم موكلتي أي مبالغ. خامسا: لدى موكلتي ما يثبت إهمال المدعي وعليه فموكلتي لها الحق بالمطالبة بنسبة التحصيل بناء على م١٣/٤ من عقد الامتياز والتي نصت على : في حالة إهمال الطرف الثاني عليه تحمل النسبة نسبة 7% من المبيعات التي تقل عن نقطة التعادل . سادسا : مطالبة المدعي بنصيبه من عوائد المكافآت الممنوحة فهي مطالبة دون وجه حق حيث أنه تم احتسابها له وإعطاؤه أثناء فترة التعاقد، ويوجد لدينا ما يثبت ذلك. وتأسيسا على ذلك أطلب من فضيلتكم إلزام الخبير بأخذ ما لدى موكلتي من بينات، ورد دعوى المدعي لعدم صحتها). انتهى ما ورد بمذكرة وكيل المدعى عليها. فطلبت الدائرة من وكيلة المدعى عليها تقديم ما لديها من بينات أو مستندات والتي أشير إليها في هذا الرد، وأمهلتها إلى الجلسة القادمة، وعليه قررت الدائرة تحديد جلسة أخرى. وفي الجلسة المنعقدة بتاريخ 7/ 9/ 1444هـ حضر الطرفان، وقدم وكيل المدعية مذكرة جاء فيها ما يلي: ( أولا: استدلال المدعى عليها بالتقصير والإهمال في الفرع، مقارنة بمبيعات المالك الجديد استدلال في غير محله، لما يلي من أسباب: قامت موكلتي بتشغيل الفرع في بداية التعاقد مع المدعى عليها بدون تشغيل',
    '[السياق: يتعلق هذا الجزء بوقائع القضية حيث تقدم المدعي بدعوى مطالبة المدعى عليه بسداد مبلغ 130,000 ريال كأتعاب محاماة، وأصدرت المحكمة حكمًا بإلزام المدعى عليه بالدفع. ثم قدم المدعى عليه استئنافًا طالبًا إعادة النظر وإرسال المعاملة للخبراء، وتم تحديد جلسة عبر الاتصال المرئي. وقررت المحكمة قبول الاستئناف شكليًا وتأييد الحكم الابتدائي لعدم وجود ما يعيبه.]\nFacts : بما أن واقعات القضية أوردها الحكم محل الاستئناف فالدائرة تحيل إليه درءا للتكرار، وتتلخص في أن المدعي وكالة تقدم بلائحة دعوى طلب فيها بإلزام المدعى عليه بسداد مبلغ قدره (130.000) مائة وثلاثون ألف ريال تمثل أتعاب المحاماة. وبإحالتها إلى الدائرة ناظرة القضية أصدرت حكمها محل الاستئناف القاضي بإلزام المدعى عليه بدفع المبلغ ، فقدم وكيل المدعى عليه لائحته الاستئنافية التي تضمنت طلب إعادة النظر في الحكم، وطلب إرسال المعاملة لقسم الخبراء بالمحكمة العامة بالرياض. وبعد قيدها في الاستئناف بالرقم المشار إليه أعلاه أحيلت رفق القضية إلى هذه الدائرة، التي حددت جلسة هذا اليوم العلنية عبر الاتصال المرئي. وبعد تبليغ الأطراف واستنادا إلى المادة 78 / 2 من نظام المحاكم التجارية والمادة 215 من اللائحة التنفيذية وبعد دراسة القضية، أصدرت الدائرة حكمها الماثل. Reasons : بما أن الاستئناف قدم أثناء الأجل المحدد فهو مقبول شكلا. أما فيما يتعلق بالموضوع فإن الدائرة لم يظهر لها في الاعتراض ما يحول دون تأييد الحكم محمولا على أسبابه. وقد تكفل الحكم بالرد على ما أبداه المستأنف في استئنافه. Ruling :',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 134,964 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 10 tokens
    • mean: 13.68 tokens
    • max: 25 tokens
    • min: 168 tokens
    • mean: 434.68 tokens
    • max: 512 tokens
  • Samples:
    sentence_0 sentence_1
    ما هي المستندات المطلوبة لإثبات دعوى تأجير سيارات؟ [السياق: يستكمل هذا الجزء تفاصيل المذكرات والمستندات المقدمة من المدعية لإثبات دعواها، بما في ذلك العقد وسندات تسليم السيارات وتفويض المدعى عليها، مع استثناء سيارة الرانج روفر لعدم وجود تفويض. وقررت المحكمة قبول الأدلة المقدمة ما عدا ما يتعلق بسيارة الرانج روفر.]
    الدائرة وكيل المدعية عن دعواه؟ فأحال على صحيفة الدعوى والطلب المذيلة به وقرر أنه لديه تحريرا للدعوى يرغب في تقديمه وأكد أنه سبق اللجوء للمصالحة وتعذر الصلح بموجب تقرير صدر بذلك استعد بتزويد الدائرة بنسخة منه، ثم بتاريخ 1443/11/28هـ قدم وكيل المدعية مذكرة من خمس مرفقات عبارة عن صورة من العقد المبرم بين الطرفين مختوم وموقع من الطرفين، وأربع سندات تفيد تسليم السيارات محل مبلغ المطالبة لأفراد بموجب تفويض صادر من المدعى عليها عدا ما يتعلق بالسيارة من طراز الرانج روفر فإنها خلت من ورقة التفويض، كما أعاد فيها تحرير دعواه بما نصه: (لقد قامت موكلتي بالتعاقد مع المدعى عليها بتاريخ 1437/03/24هـ الموافق 2015/01/04هـ، حيث نصت الاتفاقية على أن تقوم المدعى عليها بتعميد المدعية في استئجار (4) سيارات تخدم مصالحها، وحيث قامت المدعى عليها خلال...
    ما هي شروط اختصاص المحكمة التجارية مكانياً ونوعياً؟ [السياق: يختتم هذا الجزء الأسباب القانونية للحكم، حيث تؤكد المحكمة اختصاصها المكاني والنوعي نظرًا لمقر المدعى عليه في جدة وطبيعة النزاع التجاري. وقررت المحكمة إلزام المدعى عليه بسداد المبلغ المتبقي البالغ 80,000 ريال بناء على الأدلة المقدمة.]
    الكترونية منتجا لآثاره النظامية وتبليغا لشخص المرسل إليه وحيث إن الفقرة الأولى من المادة الثلاثون من نظام المحكمة التجارية الصادر بالمرسوم الملكي الكريم رقم (م/93) في 15-8-1441هــ نصت على أنه (إذا تبلغ المدعى عليه لشخصه أو وكليه، أو حضر أي منهما في أي جلسة أمام المحكمة، أو قدم مذكرة بدفاعه، عدت الخصومة حضورية، ولو تخلف بعد ذلك) وحيث ثبت للدائرة تبلغ المدعي عليه، وحيث لم يحضر المدعى عليه او من يمثله رغم تبلغه بموعد هذه الجلسة ولم يقدم إجابته على دعوى المدعية، مما يعد ذلك نكولا عن الإجابة في الدعوى وهو بمنزلة الإقرار الضمني بمضمونها مما يجسد قناعة الدائرة الى الحكم بما يرد في منطوقها أدناه الاسباب : تأسيسا على الوقائع سالفة البيان وبما أن هذه المنازعة تندرج تحت نص المادة (16) من نظام المحكمة التجارية الصادر بالمرسوم الملكي الكريم رقم (م/93) في 15-8-...
    ما هي إجراءات إيداع محضر التحقيق وتقريره؟ [إيداع محضر التحقيق وتقريره، طلبات القاضي المحقق معه، والتعامل مع التحقيقات السابقة.]
    العنوان : لائحة التفتيش القضائي

    فللرئيس، ولمن ينيبه عن طريق الرئيس؛ عرض الشكوى على المجلس. المادة الثامنة والثلاثون ١- تبلغ الإدارة القاضي بالشكوى –عند الاقتضاء -؛ لطلب إجابته عليها، بعد فحص الشكوى، والتحقق من استيفاء شروط قبولها. ٢- يرفع القاضي إجابته على الشكوى –كتابة –إلى الإدارة خلال (ثلاثين) يوما من تأريخ تبلغه بها، ما لم يتضمن كتاب الإدارة تحديد مدة أخرى، ويرفق مع إجابته ما يتعلق بها من مستندات –إن وجدت -. ٣- تتولى الإدارة العامة للقضايا دراسة موضوع الشكوى، وإجابة القاضي عليها، والمستندات المرافقة. ٤- تعرض نتيجة الدراسة على رئيس الإدارة، مشفوعة بمذكرة الرأي فيها، مع التسبيب، خلال (خمسة عشر) يوما من تأريخ ورود الإجابة على الشكوى. ٥- إذا ظهر لرئيس الإدارة ما يستدعي التحقيق في موضوع الشكوى؛ فيرفع إلى المجلس بوساطة الرئيس توصية بطلب التحقيق، محددا المخالفات التي يرى التحقيق فيها؛ ليقرر المجلس ما يراه. المادة التاسعة والثلاثون إذا صدر من المجلس قرار بالتحقيق، يكلف الرئيس –كتابة –من يقوم بالتحقيق؛ من...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • num_train_epochs: 1
  • fp16: True
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • tp_size: 0
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss
0.1185 500 0.8943
0.2371 1000 0.574
0.3556 1500 0.5298
0.4742 2000 0.4717
0.5927 2500 0.4592
0.7112 3000 0.4635
0.8298 3500 0.4375
0.9483 4000 0.424

Framework Versions

  • Python: 3.11.12
  • Sentence Transformers: 4.1.0
  • Transformers: 4.51.3
  • PyTorch: 2.7.0+cu126
  • Accelerate: 1.6.0
  • Datasets: 3.5.1
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
4
Safetensors
Model size
135M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for sultanalolait/Omarv1-Finetuned