selmanbaysan's picture
Pushing the final model to the hub
aaaf91c verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:60000000
  - loss:MultipleNegativesRankingLoss
base_model: dbmdz/bert-base-turkish-cased
widget:
  - source_sentence: Tasman Denizi
    sentences:
      - >-
        (Grekçe: Πέργαμον), günümüzde İzmir iline bağlı Bergama ilçesinin
        merkezinin yerinde kurulu antik kentin adıdır. , eski çağlarda Misya
        bölgesinin önemli merkezlerinden biriydi. MÖ 282-133 arasında da
        Krallığı'nın başkentiydi. adı, bir söylence kahramanı olan Pergamos'tan
        gelir. Pergamos'un, Teuthrania kralını öldürdükten sonra kenti ele
        geçirdiği ve kendi adını verdiği sanılır. Başka bir söylenceye göre de
        Teuthrania Kralı Grynos savaşta Pergamos'tan yardım istemiş, zaferden
        sonra iki kent kurdurarak birine onun onuruna , ötekine de Gryneion
        adını vermiştir.
      - ", Okyanusya bölgesinde Büyük Okyanus'a bağlı bir deniz. Avustralya ve Yeni Zelanda arasında yaklaşık 2000\_km boyunca uzanır. Avustralya'nın doğu eyaletleri olan Yeni Güney Galler, Tasmanya, Queensland ve Victoria eyaletleri Yeni Zelanda'nın batısı ve Yeni Kaledonya'ya kıyıları vardır. Queensland ve Yeni Kaledonya arasındaki boğaz ile Mercan Denizi'nden ayrılır."
      - >-
        (ya da Soundtrack from the Film More), Barbet Schroeder tarafından
        yönetilmiş More filminin soundtrack'idir. Pink Floyd'un bu ilk
        soundtrack çalışması aynı zamanda Syd Barrett olmadan yapılan ilk
        albümdür. Önceki albümlerdeki prodüktör Norman Smith burada yerini Pink
        Floyd'un kendisine bırakmışıtr. Pink Floyd bu ve sonraki
        soundtrack'lerinde esas albümlerinde kullanmayacakları materyalleri
        kullanacak, değişik tarzlarda denemeler yapacaktı. Albüm kısa pop/folk
        şarkıları, doğaçlamalar, The Nile Song ve Ibiza Bar gibi hard rock
        kategorisinde değerlendirilebilecek parçalardan oluşmaktadır. A Spanish
        Piece gibi birçok şarkı ısmarlama şeklinde bestelenmiştir.
  - source_sentence: Windows 95
    sentences:
      - ", Yerküre'de yer alan ana biyom tiplerinden birisidir. , yıllık 250\_mm'den az yağış alan bölgeler için kullanılan bir terimdir."
      - >-
        , sabit bir sıcaklık ve sabit bir gerilme altında, malzemede oluşan
        gerilmenin zamana göre değişimini tespit eden bir deneydir. gerilme
        gevşemesi deneyi de Sürünme deneyine benzer olarak uzun zaman
        dilimlerinde gerçekleştirilebilen bir deneydir. Son zamanlarda gerilme
        gevşemesi deneyi giderek yaygınlık kazanmaktadır özellikle arabaların
        amortisör kısımlarında kullanılan çeliklerin geliştirilmesi konusunda
        mutlak gereklilik duyulmaktadır çünkü bu malzemelerden istenen temel
        özellik herhangi bir gerilim anında oluşan enerjiyi absorbe ederek daha
        sonra serbest bırakması istenir. ile malzemenin yoğun olduğu
        bölgelerdeki bu bölgeler döküm, plastik şekil verme ve kaynaktır. Isıl
        işlemin kalıcı iç gerilmelere ve bunların giderilmesine olan etkisini
        test eden bir deneydir.

        Gerilme gevşemesi ile malzemelerin mekanik özellikleri arasında bir
        ilişki olup bu ilişkiden faydalanarak aktivasyon enerjisi, deformasyon
        hızı duyarlılığı üssü, dislokasyon hareketi için gerekli etkin gerilme,
        dislokasyon hızı gerilme üssü gibi mekanik özelliklerle ilgili bazı
        parametreler de gerilme gevşemesi deneyi ile tespit edilir.
      - >-
        , Microsoft'un ürettiği işletim sistemi ailesi Windows'un MS-DOS
        üzerinde yükselen dördüncü ana sürümüdür.
  - source_sentence: Soyuz 18-1
    sentences:
      - >-
        (Soyuz 18a, 5 Nisan anomalisi), Sovyetler Birliği tarafından fırlatılan
        insanlı uzay aracı. Arıza nedeniyle yörüngeye ulaşamadan içindeki iki
        kozmonotla birlikte düştü. Acil iniş sisteminin çalışması nedeniyle
        kozmonotlar Vasili Lazarev ve Oleg Makarov yara almadan kurtuldular.
      - >-
        (İbranice: חיים רביבו) (d.22 Şubat 1972, Aşdod) İsrailli eski millî
        futbolcudur.
      - >-
        , ilk olarak genel anlamda Perry Anderson'un Üzerine Düşünceler
        kitabında bahsettiği anlamda, 19. yüzyıldan ve 20. yüzyıla Marksizmin
        Batı'daki hikâyesinden oluşur. Bu anlamda Marks'ın eserinden bugüne
        kadarki gelişimi, ayrışmaları, iç bölümlenmeleri, farklılıklarıyla
        teorik ve politik bir sistematik öğreti olarak Marksizmin Batı
        düşüncesindeki ve pratiğindeki yeri değerlendirilir. Karl Kautsky ve
        Lenin'in tartışmaları da bu bağlamda genel anlamdaki bu içinde yer alır.
  - source_sentence: Yukarıkarakaya
    sentences:
      - Doğançam, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.
      - >-
        Sultan , III. Mustafa’nın yaptırdığı Laleli Külliyesi'ndedir. Bu türbe
        Nuruosmaniye Türbesi'nden sonra Batı etkilerinin görüldüğü ikinci sultan
        türbesidir. Ordu caddesi üzerinde Laleli Camii'nin giriş kapısı ile han
        bölümünün yan tarafıdır. 1759–1763 yıllarında Mimar Mehmed Tahir Ağa'ya
        inşa ettirilmiştir.
      - ', Yozgat ilinin Çekerek ilçesine bağlı bir köydür.'
  - source_sentence: Aksaz, Manavgat
    sentences:
      - >-
        , (d. Şubat 1882, Mekke, Osmanlı İmparatorluğu - ö. 20 Temmuz 1951,
        Kudüs, Filistin), Ürdün Kralı. Arap-İsrail savaşları sırasında
        öldürüldü, yerine oğlu 1. Talal geçmiştir.
      - (1961, Şereflikoçhisar, Ankara) Türk halk müziği sanatçısı.
      - Aksaz, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.
datasets:
  - selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
  - cosine_accuracy_threshold
  - cosine_f1
  - cosine_f1_threshold
  - cosine_precision
  - cosine_recall
  - cosine_ap
  - cosine_mcc
model-index:
  - name: SentenceTransformer based on dbmdz/bert-base-turkish-cased
    results:
      - task:
          type: binary-classification
          name: Binary Classification
        dataset:
          name: dev
          type: dev
        metrics:
          - type: cosine_accuracy
            value: 0.9999989554433933
            name: Cosine Accuracy
          - type: cosine_accuracy_threshold
            value: -0.10191559791564941
            name: Cosine Accuracy Threshold
          - type: cosine_f1
            value: 0.9999994777214238
            name: Cosine F1
          - type: cosine_f1_threshold
            value: -0.10191559791564941
            name: Cosine F1 Threshold
          - type: cosine_precision
            value: 1
            name: Cosine Precision
          - type: cosine_recall
            value: 0.9999989554433933
            name: Cosine Recall
          - type: cosine_ap
            value: 0.9999999999999996
            name: Cosine Ap
          - type: cosine_mcc
            value: 0
            name: Cosine Mcc

SentenceTransformer based on dbmdz/bert-base-turkish-cased

This is a sentence-transformers model finetuned from dbmdz/bert-base-turkish-cased on the turkish_weakly_supervised_contrastive_learning_dataset dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("selmanbaysan/bert-base-turkish-cased_large_scale_contrastive_learning")
# Run inference
sentences = [
    'Aksaz, Manavgat',
    'Aksaz, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.',
    ', (d. Şubat 1882, Mekke, Osmanlı İmparatorluğu - ö. 20 Temmuz 1951, Kudüs, Filistin), Ürdün Kralı. Arap-İsrail savaşları sırasında öldürüldü, yerine oğlu 1. Talal geçmiştir.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Binary Classification

Metric Value
cosine_accuracy 1.0
cosine_accuracy_threshold -0.1019
cosine_f1 1.0
cosine_f1_threshold -0.1019
cosine_precision 1.0
cosine_recall 1.0
cosine_ap 1.0
cosine_mcc 0.0

Training Details

Training Dataset

turkish_weakly_supervised_contrastive_learning_dataset

  • Dataset: turkish_weakly_supervised_contrastive_learning_dataset at bf99eda
  • Size: 60,000,000 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 3 tokens
    • mean: 5.02 tokens
    • max: 16 tokens
    • min: 9 tokens
    • mean: 73.1 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Cengiz Han (doğum adıyla Temuçin, – 18 Ağustos 1227), Moğol İmparatorluğu'nun kurucusu ve ilk Kağanı olan Moğol komutan ve hükümdardır. Hükümdarlığı döneminde gerçekleştirdiği hiçbir savaşı kaybetmeyen , dünya tarihinin en büyük askeri liderlerinden birisi olarak kabul edilmektedir. 13. yüzyılın başında Orta Asya'daki tüm göçebe bozkır kavimlerini birleştirip bir ulus hâline getirerek Moğol siyasi kimliği çatısı altında toplamıştır. , hükümdarlığı döneminde, 1206-1227 arasında, Kuzey Çin'deki Batı Xia ve Jin Hanedanı; Türkistan'daki Kara Hıtay, Maveraünnehir; Harezm, Horasan ve İran'daki Harezmşahlar, Kafkasya'daki Gürcüler, Deşt-i Kıpçak'taki Rus Knezlikleri, Kıpçaklar ile İdil Bulgarları üzerine seferler yaptı ve imparatorluğu döneminde gerçekleştirdiği hiçbir savaşı kaybetmedi. Bunların sonucunda Pasifik Okyanusu'ndan Hazar Denizi'ne ve Karadeniz'in kuzeyine kadar uzanan bir imparatorluk kurdu.
    Mustafa Suphi Mehmed Mustafa Subhi (), kısaca , veya bazı kaynaklarda kullanıldığı haliyle Osmanlıca yazıma göre Mustafa Subhi (4 Ağustos 1882 veya 4 Mayıs 1883 - 28 Ocak 1921), Türk komünist ve Türkiye Komünist Partisinin ilk Merkez Komitesi Başkanı.
    Linux (telaffuz: Lin-uks); çekirdeğine dayalı, açık kaynak kodlu, Unix benzeri bir işletim sistemi ailesidir. GNU Genel Kamu Lisansı versiyon 2 ile sunulan ve Vakfı çatısı altında geliştirilen bir özgür yazılım projesidir. ismi ilk geliştiricisi olan Linus Torvalds tarafından 1991 yılında verilmiştir. Günümüzde süper bilgisayarlarda, akıllı cihazların ve internet altyapısında kullanılan cihazların işletim sistemlerinde yaygın olarak kullanılmaktadır. Bunlardan en popüler olanı Google tarafından geliştirilen Android işletim sistemidir.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

turkish_weakly_supervised_contrastive_learning_dataset

  • Dataset: turkish_weakly_supervised_contrastive_learning_dataset at bf99eda
  • Size: 957,344 evaluation samples
  • Columns: sentence1, sentence2, and label
  • Approximate statistics based on the first 1000 samples:
    sentence1 sentence2 label
    type string string int
    details
    • min: 3 tokens
    • mean: 6.67 tokens
    • max: 21 tokens
    • min: 10 tokens
    • mean: 48.63 tokens
    • max: 457 tokens
    • 1: 100.00%
  • Samples:
    sentence1 sentence2 label
    S. Murat Demiral 1966 İstanbul doğumlu Türk müzisyen. 1976 yılında İstanbul devlet konservatuvarında Ziya Polat ile trombona başladı 1977 yılında İstanbul Belediye konservatuvarına geçtı burada 1 yıl Mahmut Doğuduyal ile çalıştı 1978 yılında tekrar Ziya Polat ile çalışmaya başladı. 1980 yılında İstanbul Devlet Opera ve Balesi Orkestrası'nın sınavını kazandı. 1
    Türkiye'nin illeri Anadolu yarımadası ile Trakya toprakları üzerine kurulan Türkiye'nin, 81 ili vardır. İller, Türkiye'nin en büyük idari bölümleridir. Bu seksen bir il, dokuz yüz yetmiş üç ilçeye bölünmüştür. Bu ilçeler, en küçük idari birim olan mahalle ve köyleri içinde barındırır. İllerde yönetme ve yürütme görevi, içişleri bakanı tarafından önerilen ve bakanlar kurulunun onayından sonra cumhurbaşkanı tarafından atanan valiler tarafından yerine getirilir. 1
    Cezayir (Arapça: الجزائر al-ġazaʾir; Berberi dilleri: ⴷⵣⴰⵢⴻⵔ Dzayer) ya da resmî adıyla Demokratik Halk Cumhuriyeti (Arapça: الجمهورية الجزائرية الديمقراطية الشّعبية), Kuzey Afrika'da ülke. 2,381,741 kilometre karelik yüzölçümü ile Afrika'nın yüzölçümü olarak en büyük ülkesi olan , dünyanın onuncu, Arap Dünyası ve Afrika Birliği içerisinde ise en büyük ülkedir. Aynı zamanda, 44 milyonluk nüfusuyla da Afrika'nın en kalabalık sekizinci ülkesidir. 1
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • learning_rate: 2e-05
  • num_train_epochs: 1
  • lr_scheduler_type: cosine_with_restarts
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: cosine_with_restarts
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • tp_size: 0
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss dev_cosine_ap
0.5333 500000 0.2938 0.2648 1.0000
0.5867 550000 0.2848 0.2557 1.0000
0.64 600000 0.2757 0.2482 1.0000
0.6933 650000 0.268 0.2419 1.0000
0.7467 700000 0.2619 0.2368 1.0000
0.8 750000 0.257 0.2324 1.0000
0.8533 800000 0.254 0.2296 1.0000
0.9067 850000 0.2507 0.2279 1.0000
0.96 900000 0.2498 0.2271 1.0000

Framework Versions

  • Python: 3.10.6
  • Sentence Transformers: 4.1.0
  • Transformers: 4.51.3
  • PyTorch: 2.7.0+cu126
  • Accelerate: 1.6.0
  • Datasets: 3.5.1
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}