---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:60000000
- loss:MultipleNegativesRankingLoss
base_model: dbmdz/bert-base-turkish-cased
widget:
- source_sentence: Tasman Denizi
sentences:
- '(Grekçe: Πέργαμον), günümüzde İzmir iline bağlı Bergama ilçesinin merkezinin
yerinde kurulu antik kentin adıdır. , eski çağlarda Misya bölgesinin önemli merkezlerinden
biriydi. MÖ 282-133 arasında da Krallığı''nın başkentiydi. adı, bir söylence kahramanı
olan Pergamos''tan gelir. Pergamos''un, Teuthrania kralını öldürdükten sonra kenti
ele geçirdiği ve kendi adını verdiği sanılır. Başka bir söylenceye göre de Teuthrania
Kralı Grynos savaşta Pergamos''tan yardım istemiş, zaferden sonra iki kent kurdurarak
birine onun onuruna , ötekine de Gryneion adını vermiştir.'
- ', Okyanusya bölgesinde Büyük Okyanus''a bağlı bir deniz. Avustralya ve Yeni Zelanda
arasında yaklaşık 2000 km boyunca uzanır. Avustralya''nın doğu eyaletleri olan
Yeni Güney Galler, Tasmanya, Queensland ve Victoria eyaletleri Yeni Zelanda''nın
batısı ve Yeni Kaledonya''ya kıyıları vardır. Queensland ve Yeni Kaledonya arasındaki
boğaz ile Mercan Denizi''nden ayrılır.'
- (ya da Soundtrack from the Film More), Barbet Schroeder tarafından yönetilmiş
More filminin soundtrack'idir. Pink Floyd'un bu ilk soundtrack çalışması aynı
zamanda Syd Barrett olmadan yapılan ilk albümdür. Önceki albümlerdeki prodüktör
Norman Smith burada yerini Pink Floyd'un kendisine bırakmışıtr. Pink Floyd bu
ve sonraki soundtrack'lerinde esas albümlerinde kullanmayacakları materyalleri
kullanacak, değişik tarzlarda denemeler yapacaktı. Albüm kısa pop/folk şarkıları,
doğaçlamalar, The Nile Song ve Ibiza Bar gibi hard rock kategorisinde değerlendirilebilecek
parçalardan oluşmaktadır. A Spanish Piece gibi birçok şarkı ısmarlama şeklinde
bestelenmiştir.
- source_sentence: Windows 95
sentences:
- ', Yerküre''de yer alan ana biyom tiplerinden birisidir. , yıllık 250 mm''den
az yağış alan bölgeler için kullanılan bir terimdir.'
- ', sabit bir sıcaklık ve sabit bir gerilme altında, malzemede oluşan gerilmenin
zamana göre değişimini tespit eden bir deneydir. gerilme gevşemesi deneyi de Sürünme
deneyine benzer olarak uzun zaman dilimlerinde gerçekleştirilebilen bir deneydir.
Son zamanlarda gerilme gevşemesi deneyi giderek yaygınlık kazanmaktadır özellikle
arabaların amortisör kısımlarında kullanılan çeliklerin geliştirilmesi konusunda
mutlak gereklilik duyulmaktadır çünkü bu malzemelerden istenen temel özellik herhangi
bir gerilim anında oluşan enerjiyi absorbe ederek daha sonra serbest bırakması
istenir. ile malzemenin yoğun olduğu bölgelerdeki bu bölgeler döküm, plastik şekil
verme ve kaynaktır. Isıl işlemin kalıcı iç gerilmelere ve bunların giderilmesine
olan etkisini test eden bir deneydir.
Gerilme gevşemesi ile malzemelerin mekanik özellikleri arasında bir ilişki olup
bu ilişkiden faydalanarak aktivasyon enerjisi, deformasyon hızı duyarlılığı üssü,
dislokasyon hareketi için gerekli etkin gerilme, dislokasyon hızı gerilme üssü
gibi mekanik özelliklerle ilgili bazı parametreler de gerilme gevşemesi deneyi
ile tespit edilir.'
- ', Microsoft''un ürettiği işletim sistemi ailesi Windows''un MS-DOS üzerinde yükselen
dördüncü ana sürümüdür.'
- source_sentence: Soyuz 18-1
sentences:
- (Soyuz 18a, 5 Nisan anomalisi), Sovyetler Birliği tarafından fırlatılan insanlı
uzay aracı. Arıza nedeniyle yörüngeye ulaşamadan içindeki iki kozmonotla birlikte
düştü. Acil iniş sisteminin çalışması nedeniyle kozmonotlar Vasili Lazarev ve
Oleg Makarov yara almadan kurtuldular.
- '(İbranice: חיים רביבו) (d.22 Şubat 1972, Aşdod) İsrailli eski millî futbolcudur.'
- ', ilk olarak genel anlamda Perry Anderson''un Üzerine Düşünceler kitabında bahsettiği
anlamda, 19. yüzyıldan ve 20. yüzyıla Marksizmin Batı''daki hikâyesinden oluşur.
Bu anlamda Marks''ın eserinden bugüne kadarki gelişimi, ayrışmaları, iç bölümlenmeleri,
farklılıklarıyla teorik ve politik bir sistematik öğreti olarak Marksizmin Batı
düşüncesindeki ve pratiğindeki yeri değerlendirilir. Karl Kautsky ve Lenin''in
tartışmaları da bu bağlamda genel anlamdaki bu içinde yer alır.'
- source_sentence: Yukarıkarakaya
sentences:
- Doğançam, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.
- Sultan , III. Mustafa’nın yaptırdığı Laleli Külliyesi'ndedir. Bu türbe Nuruosmaniye
Türbesi'nden sonra Batı etkilerinin görüldüğü ikinci sultan türbesidir. Ordu caddesi
üzerinde Laleli Camii'nin giriş kapısı ile han bölümünün yan tarafıdır. 1759–1763
yıllarında Mimar Mehmed Tahir Ağa'ya inşa ettirilmiştir.
- ', Yozgat ilinin Çekerek ilçesine bağlı bir köydür.'
- source_sentence: Aksaz, Manavgat
sentences:
- ', (d. Şubat 1882, Mekke, Osmanlı İmparatorluğu - ö. 20 Temmuz 1951, Kudüs, Filistin),
Ürdün Kralı. Arap-İsrail savaşları sırasında öldürüldü, yerine oğlu 1. Talal geçmiştir.'
- (1961, Şereflikoçhisar, Ankara) Türk halk müziği sanatçısı.
- Aksaz, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.
datasets:
- selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
- cosine_accuracy_threshold
- cosine_f1
- cosine_f1_threshold
- cosine_precision
- cosine_recall
- cosine_ap
- cosine_mcc
model-index:
- name: SentenceTransformer based on dbmdz/bert-base-turkish-cased
results:
- task:
type: binary-classification
name: Binary Classification
dataset:
name: dev
type: dev
metrics:
- type: cosine_accuracy
value: 0.9999989554433933
name: Cosine Accuracy
- type: cosine_accuracy_threshold
value: -0.10191559791564941
name: Cosine Accuracy Threshold
- type: cosine_f1
value: 0.9999994777214238
name: Cosine F1
- type: cosine_f1_threshold
value: -0.10191559791564941
name: Cosine F1 Threshold
- type: cosine_precision
value: 1.0
name: Cosine Precision
- type: cosine_recall
value: 0.9999989554433933
name: Cosine Recall
- type: cosine_ap
value: 0.9999999999999996
name: Cosine Ap
- type: cosine_mcc
value: 0.0
name: Cosine Mcc
---
# SentenceTransformer based on dbmdz/bert-base-turkish-cased
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [dbmdz/bert-base-turkish-cased](https://huggingface.co/dbmdz/bert-base-turkish-cased) on the [turkish_weakly_supervised_contrastive_learning_dataset](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset) dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [dbmdz/bert-base-turkish-cased](https://huggingface.co/dbmdz/bert-base-turkish-cased)
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
- **Training Dataset:**
- [turkish_weakly_supervised_contrastive_learning_dataset](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset)
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("selmanbaysan/bert-base-turkish-cased_large_scale_contrastive_learning")
# Run inference
sentences = [
'Aksaz, Manavgat',
'Aksaz, Antalya ilinin Manavgat ilçesine bağlı bir mahalledir.',
', (d. Şubat 1882, Mekke, Osmanlı İmparatorluğu - ö. 20 Temmuz 1951, Kudüs, Filistin), Ürdün Kralı. Arap-İsrail savaşları sırasında öldürüldü, yerine oğlu 1. Talal geçmiştir.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
## Evaluation
### Metrics
#### Binary Classification
* Dataset: `dev`
* Evaluated with [BinaryClassificationEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
| Metric | Value |
|:--------------------------|:--------|
| cosine_accuracy | 1.0 |
| cosine_accuracy_threshold | -0.1019 |
| cosine_f1 | 1.0 |
| cosine_f1_threshold | -0.1019 |
| cosine_precision | 1.0 |
| cosine_recall | 1.0 |
| **cosine_ap** | **1.0** |
| cosine_mcc | 0.0 |
## Training Details
### Training Dataset
#### turkish_weakly_supervised_contrastive_learning_dataset
* Dataset: [turkish_weakly_supervised_contrastive_learning_dataset](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset) at [bf99eda](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset/tree/bf99eda89b8fa45f7f5c82b490fd875e93ffd5fe)
* Size: 60,000,000 training samples
* Columns: anchor and positive
* Approximate statistics based on the first 1000 samples:
| | anchor | positive |
|:--------|:---------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|
| type | string | string |
| details |
Cengiz Han | (doğum adıyla Temuçin, – 18 Ağustos 1227), Moğol İmparatorluğu'nun kurucusu ve ilk Kağanı olan Moğol komutan ve hükümdardır. Hükümdarlığı döneminde gerçekleştirdiği hiçbir savaşı kaybetmeyen , dünya tarihinin en büyük askeri liderlerinden birisi olarak kabul edilmektedir. 13. yüzyılın başında Orta Asya'daki tüm göçebe bozkır kavimlerini birleştirip bir ulus hâline getirerek Moğol siyasi kimliği çatısı altında toplamıştır. , hükümdarlığı döneminde, 1206-1227 arasında, Kuzey Çin'deki Batı Xia ve Jin Hanedanı; Türkistan'daki Kara Hıtay, Maveraünnehir; Harezm, Horasan ve İran'daki Harezmşahlar, Kafkasya'daki Gürcüler, Deşt-i Kıpçak'taki Rus Knezlikleri, Kıpçaklar ile İdil Bulgarları üzerine seferler yaptı ve imparatorluğu döneminde gerçekleştirdiği hiçbir savaşı kaybetmedi. Bunların sonucunda Pasifik Okyanusu'ndan Hazar Denizi'ne ve Karadeniz'in kuzeyine kadar uzanan bir imparatorluk kurdu. |
| Mustafa Suphi | Mehmed Mustafa Subhi (), kısaca , veya bazı kaynaklarda kullanıldığı haliyle Osmanlıca yazıma göre Mustafa Subhi (4 Ağustos 1882 veya 4 Mayıs 1883 - 28 Ocak 1921), Türk komünist ve Türkiye Komünist Partisinin ilk Merkez Komitesi Başkanı. |
| Linux | (telaffuz: Lin-uks); çekirdeğine dayalı, açık kaynak kodlu, Unix benzeri bir işletim sistemi ailesidir. GNU Genel Kamu Lisansı versiyon 2 ile sunulan ve Vakfı çatısı altında geliştirilen bir özgür yazılım projesidir. ismi ilk geliştiricisi olan Linus Torvalds tarafından 1991 yılında verilmiştir. Günümüzde süper bilgisayarlarda, akıllı cihazların ve internet altyapısında kullanılan cihazların işletim sistemlerinde yaygın olarak kullanılmaktadır. Bunlardan en popüler olanı Google tarafından geliştirilen Android işletim sistemidir. |
* Loss: [MultipleNegativesRankingLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Evaluation Dataset
#### turkish_weakly_supervised_contrastive_learning_dataset
* Dataset: [turkish_weakly_supervised_contrastive_learning_dataset](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset) at [bf99eda](https://huggingface.co/datasets/selmanbaysan/turkish_weakly_supervised_contrastive_learning_dataset/tree/bf99eda89b8fa45f7f5c82b490fd875e93ffd5fe)
* Size: 957,344 evaluation samples
* Columns: sentence1, sentence2, and label
* Approximate statistics based on the first 1000 samples:
| | sentence1 | sentence2 | label |
|:--------|:---------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:-----------------------------|
| type | string | string | int |
| details | S. Murat Demiral | 1966 İstanbul doğumlu Türk müzisyen. 1976 yılında İstanbul devlet konservatuvarında Ziya Polat ile trombona başladı 1977 yılında İstanbul Belediye konservatuvarına geçtı burada 1 yıl Mahmut Doğuduyal ile çalıştı 1978 yılında tekrar Ziya Polat ile çalışmaya başladı. 1980 yılında İstanbul Devlet Opera ve Balesi Orkestrası'nın sınavını kazandı. | 1 |
| Türkiye'nin illeri | Anadolu yarımadası ile Trakya toprakları üzerine kurulan Türkiye'nin, 81 ili vardır. İller, Türkiye'nin en büyük idari bölümleridir. Bu seksen bir il, dokuz yüz yetmiş üç ilçeye bölünmüştür. Bu ilçeler, en küçük idari birim olan mahalle ve köyleri içinde barındırır. İllerde yönetme ve yürütme görevi, içişleri bakanı tarafından önerilen ve bakanlar kurulunun onayından sonra cumhurbaşkanı tarafından atanan valiler tarafından yerine getirilir. | 1 |
| Cezayir | (Arapça: الجزائر al-ġazaʾir; Berberi dilleri: ⴷⵣⴰⵢⴻⵔ Dzayer) ya da resmî adıyla Demokratik Halk Cumhuriyeti (Arapça: الجمهورية الجزائرية الديمقراطية الشّعبية), Kuzey Afrika'da ülke. 2,381,741 kilometre karelik yüzölçümü ile Afrika'nın yüzölçümü olarak en büyük ülkesi olan , dünyanın onuncu, Arap Dünyası ve Afrika Birliği içerisinde ise en büyük ülkedir. Aynı zamanda, 44 milyonluk nüfusuyla da Afrika'nın en kalabalık sekizinci ülkesidir. | 1 |
* Loss: [MultipleNegativesRankingLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 64
- `per_device_eval_batch_size`: 64
- `learning_rate`: 2e-05
- `num_train_epochs`: 1
- `lr_scheduler_type`: cosine_with_restarts
- `warmup_ratio`: 0.1
- `fp16`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters