Model Card: sergeyzt50/slovak-ner-full
Prehľad
Tento model je jemne doladenou verziou modelu SlovakBERT pre úlohu rozpoznávania pomenovaných entít (NER) v slovenskom jazyku. Bol trénovaný kombináciou dát zo zdrojov WikiANN a conll2003-SK-NER, pričom využíva stratégiu transferového učenia.
Model je schopný identifikovať typy entít ako:
PER– Osoby (napr. Ján, Mária Kováčová)LOC– Miesta (napr. Bratislava, Tatry)ORG– Organizácie (napr. Univerzita Komenského, Google)MISC– Ostatné (napr. Olympijské hry, Slovenská technická univerzita)
Datasety použité na trénovanie
1. ju-bezdek/conll2003-SK-NER
2. unimelb-nlp/wikiann
Datasety boli zlúčené a ich anotácie boli zjednotené do spoločného label space.
Výsledky evaluácie
Tréningový skript vyhodnocoval presnosť každých 1000 krokov. Konečný model dosiahol tieto výsledky:
- F1-score (weighted):
0.924 - Presnosť:
0.927 - Recall:
0.921
Krivka výkonu bola stabilná a nezaznamenala známky preučenia.
Licencia
Tento model je dostupný výhradne na výskumné a nekomerčné účely. Ak máte záujem o jeho rozšírené použitie, kontaktujte autora.
Autor
Model vytvoril sergeyzt50 ako súčasť bakalárskej práce na Technickej univerzite v Košiciach, Fakulta elektrotechniky a informatiky.
Dátum poslednej úpravy: 14.05.2025
- Downloads last month
- 3
Model tree for sergeyzt50/slovak-ner-full
Base model
gerulata/slovakbert