Fa Address BERT
Collection
This collection is a set of proprietary Persian address models developed using government and non-government data.
•
3 items
•
Updated
این مدل یک نسخه از BERT-Small (28.8M پارامتر) است که از پایه بر اساس آدرس های واقعی ایران توسعه داده شده است. هدف اصلی از تولید این مدل، ریز تنظیم آن و تولید مدل های جانبی برای انجام وظایف پاکسازی، استانداردسازی و تطبیق آدرسها است.
این مدل پایه روی حدود 100 گیگابایت دادهی آدرس پاکسازیشده واقعی آموزش دیده است که از منابع زیر جمع آوری شدند:
جامع بودن و تنوع دادهها باعث شده است تا مدل توانایی بالایی در درک ساختار آدرسهای فارسی داشته باشد.
مدل روی ابررایانه سیمرغ (Simorgh Cloud) با GPU NVIDIA A100 (40GB) آموزش داده شده است.
5e-05 450 450 Adam 11 ریز تنظیم کردن و تولید مدلهای جانبی برای:
© این مدل توسط وزارت امور اقتصادی و دارایی، سازمان امور مالیاتی کشور، معاونت فناوریهای مالیاتی، دفتر علوم داده توسعه یافته است.