DGSMsRzJ6xC2JthtHG9W commited on
Commit
5c3cf5b
·
verified ·
1 Parent(s): 9679ded

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,780 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - en
4
+ license: mit
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:13186
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: nomic-ai/nomic-embed-text-v2-moe
14
+ widget:
15
+ - source_sentence: Гражданин Иванов взял в займ у гражданина Петрова 50 000 рублей
16
+ без указания процентов в договоре. Через год Иванов вернул долг. Какие проценты
17
+ должен был выплатить Иванов Петрову?
18
+ sentences:
19
+ - <p>1. Заказчик, получивший сообщение подрядчика о готовности к сдаче результата
20
+ выполненных по договору строительного подряда работ либо, если это предусмотрено
21
+ договором, выполненного этапа работ, обязан немедленно приступить к его приемке.</p><p>2.
22
+ Заказчик организует и осуществляет приемку результата работ за свой счет, если
23
+ иное не предусмотрено договором строительного подряда.</p><p>В предусмотренных
24
+ законом или иными правовыми актами случаях в приемке результата работ должны участвовать
25
+ представители государственных органов и органов местного самоуправления.</p><p>3.
26
+ Заказчик, предварительно принявший результат отдельного этапа работ, несет риск
27
+ последствий гибели или повреждения результата работ, которые произошли не по вине
28
+ подрядчика.</p><p>4. Сдача результата работ подрядчиком и приемка его заказчиком
29
+ оформляются актом, подписанным обеими сторонами. При отказе одной из сторон от
30
+ подписания акта в нем делается отметка об этом и акт подписывается другой стороной.</p><p>Односторонний
31
+ акт сдачи или приемки результата работ может быть признан судом недействительным
32
+ лишь в случае, если мотивы отказа от подписания акта признаны им обоснованными.</p><p>5.
33
+ В случаях, когда это предусмотрено законом или договором строительного подряда
34
+ либо вытекает из характера работ, выполняемых по договору, приемке результата
35
+ работ должны предшествовать предварительные испытания. В этих случаях приемка
36
+ может осуществляться только при положительном результате предварительных испытаний.</p><p>6.
37
+ Заказчик вправе отказаться от приемки результата работ в случае обнаружения недостатков,
38
+ которые исключают возможность его использования для указанной в договоре строительного
39
+ подряда цели и не могут быть устранены подрядчиком или заказчиком.</p>
40
+ - <p>Перевозчик обязан доставить груз, пассажира или багаж в пункт назначения в
41
+ сроки, определенные в порядке, предусмотренном транспортными уставами, кодексами
42
+ и иными законами, а при отсутствии таких сроков в разумный срок. (В редакции Федерального
43
+ закона <a href="102456097">от 29.12.2017 № 442-ФЗ</a>)</p>
44
+ - <p>1. Если иное не предусмотрено законом или договором займа, займодавец имеет
45
+ право на получение с заемщика процентов за пользование займом в размерах и в порядке,
46
+ определенных договором. При отсутствии в договоре условия о размере процентов
47
+ за пользование займом их размер определяется ключевой ставкой Банка России, действовавшей
48
+ в соответствующие периоды.</p><p>2. Размер процентов за пользование займом может
49
+ быть установлен в договоре с применением ставки в процентах годовых в виде фиксированной
50
+ величины, с применением ставки в процентах годовых, величина которой может изменяться
51
+ в зависимости от предусмотренных договором условий, в том числе в зависимости
52
+ от изменения переменной величины, либо иным путем, позволяющим определить надлежащий
53
+ размер процентов на момент их уплаты.</p><p>3. При отсутствии иного соглашения
54
+ проценты за пользование займом выплачиваются ежемесячно до дня возврата займа
55
+ включительно.</p><p>4. Договор займа предполагается беспроцентным, если в нем
56
+ прямо не предусмотрено иное, в случаях, когда:</p><p>договор заключен между гражданами,
57
+ в том числе индивидуальными предпринимателями, на сумму, не превышающую ста тысяч
58
+ рублей;</p><p>по договору заемщику передаются не деньги, а другие вещи, определенные
59
+ родовыми признаками.</p><p>5. Размер процентов за пользование займом по договору
60
+ займа, заключенному между гражданами или между юридическим лицом, не осуществляющим
61
+ профессиональной деятельности по предоставлению потребительских займов, и заемщиком-гражданином,
62
+ в два и более раза превышающий обычно взимаемые в подобных случаях проценты и
63
+ поэтому являющийся чрезмерно обременительным для должника (ростовщические проценты),
64
+ может быть уменьшен судом до размера процентов, обычно взимаемых при сравнимых
65
+ обстоятельствах.</p>
66
+ - source_sentence: Может ли собственник, владеющий 10% доли в общем имуществе многоквартирного
67
+ дома, отказаться от участия в оплате капитального ремонта крыши, если он считает,
68
+ что ремонт не нужен? Укажите, при каких условиях это возможно.
69
+ sentences:
70
+ - <p>При передаче в доверительное управление ценных бумаг может быть предусмотрено
71
+ объединение ценных бумаг, передаваемых в доверительное управление разными лицами.</p><p>Правомочия
72
+ доверительного управляющего по распоряжению ценными бумагами определяются в договоре
73
+ доверительного управления.</p><p>Особенности доверительного управления ценными
74
+ бумагами определяются законом.</p><p>Правила настоящей статьи соответственно применяются
75
+ к правам, удостоверенным бездокументарными ценными бумагами (статья 149).</p>
76
+ - <p>Принадлежащее пережившему супругу наследодателя в силу завещания или закона
77
+ право наследования не умаляет его права на часть имущества, нажитого во время
78
+ брака с наследодателем и являющегося их совместной собственностью. Доля умершего
79
+ супруга в этом имуществе, определяемая в соответствии со статьей 256 настоящего
80
+ Кодекса, входит в состав наследства и переходит к наследникам в соответствии с
81
+ правилами, установленными настоящим Кодексом.</p><p>Иное может быть предусмотрено
82
+ совместным завещанием супругов или наследственным договором. (Дополнение частью
83
+ - Федеральный закон <a href="102476871">от 19.07.2018 № 217-ФЗ</a>)</p>
84
+ - <p>1. Если иное не установлено единогласным решением собственников недвижимых
85
+ вещей, каждый собственник недвижимой вещи обязан участвовать в расходах и издержках
86
+ по содержанию и сохранению общего имущества соразмерно со своей долей в праве
87
+ на общее имущество (пункт 1 статьи 259.2). Собственник недвижимой вещи, в результате
88
+ действий или бездействия которого возникают дополнительные расходы и издержки
89
+ по содержанию и сохранению общего имущества, обязан их покрывать.</p><p>2. Каждый
90
+ собственник недвижимой вещи обязан соразмерно со своей долей в праве общей собственности
91
+ на общее имущество (пункт 1 статьи 259.2) участвовать в уплате налогов, сборов
92
+ и иных обязательных платежей, связанных с общим имуществом.</p>
93
+ - source_sentence: Гражданин Петров заключил наследственный договор со своей племянницей
94
+ Ивановой. Через год Петров решил отказаться от договора. Он уведомил Иванову о
95
+ своем отказе, но не удостоверил уведомление нотариально. Иванова понесла убытки
96
+ в связи с исполнением договора. Может ли Иванова требовать от Петрова возмещения
97
+ убытков, и если да, то в каком объеме?
98
+ sentences:
99
+ - <p>10. Наследодатель вправе совершить в любое время односторонний отказ от наследственного
100
+ договора путем уведомления всех сторон наследственного договора о таком отказе.
101
+ Уведомление об отказе наследодателя от наследственного договора подлежит нотариальному
102
+ удостоверению. Нотариус, удостоверивший уведомление об отказе наследодателя от
103
+ наследственного договора, обязан в порядке, предусмотренном законодательством
104
+ о нотариате и нотариальной деятельности, в течение трех рабочих дней направить
105
+ копию этого уведомления другим сторонам наследственного договора.</p><p>Наследодатель,
106
+ отказавшийся от наследственного договора, обязан возместить другим сторонам наследственного
107
+ договора убытки, которые возникли у них в связи с исполнением наследственного
108
+ договора к моменту получения копии уведомления об отказе наследодателя от наследственного
109
+ договора.</p><p>Другие стороны наследственного договора вправе совершить односторонний
110
+ отказ от наследственного договора в порядке, предусмотренном законом или наследственным
111
+ договором.</p><p>11. Наследственный договор может быть оспорен при жизни наследодателя
112
+ по иску стороны наследственного договора, а после открытия наследства по иску
113
+ лица, права или законные интересы которого нарушены этим наследственным договором.</p><p>12.
114
+ После заключения наследственного договора наследодатель вправе совершать любые
115
+ сделки в отношении принадлежащего ему имущества и иным образом распоряжаться принадлежащим
116
+ ему имуществом своей волей и в своем интересе, даже если такое распоряжение л��шит
117
+ лицо, которое может быть призвано к наследованию, прав на имущество наследодателя.
118
+ Соглашение об ином ничтожно.</p><p>(Дополнение статьей - Федеральный закон <a
119
+ href="102476871">от 19.07.2018 № 217-ФЗ</a>)</p>
120
+ - <p>В случаях, когда заказчик на основании пункта 2 статьи 715 или пункта 3 статьи
121
+ 723 настоящего Кодекса расторгает договор подряда, подрядчик обязан возвратить
122
+ предоставленные заказчиком материалы, оборудование, переданную для переработки
123
+ (обработки) вещь и иное имущество либо передать их указанному заказчиком лицу,
124
+ а если это оказалось невозможным, - возместить стоимость материалов, оборудования
125
+ и иного имущества.</p>
126
+ - <p>4. Акционеры публичного общества, голосовавшие против или не принимавшие участия
127
+ в голосовании по вопросу, указанному в пункте 3 настоящей статьи, вправе требовать
128
+ выкупа обществом принадлежащих им акций в соответствии с правилами, установленными
129
+ статьями 75 и 76 настоящего Федерального закона.</p><p>Решения по вопросу, указанному
130
+ в пункте 3 настоящей статьи, вступают в силу при условии, что общее количество
131
+ акций, в отношении которых заявлены требования о выкупе, не превышает количество
132
+ акций, которое может быть выкуплено обществом с учетом ограничения, установленного
133
+ пунктом 5 статьи 76 настоящего Федерального закона.</p><p>(Дополнение статьей
134
+ - Федеральный закон <a href="102375391">от 29.06.2015 № 210-ФЗ</a>)</p>
135
+ - source_sentence: Умерший Сидоров не оставил после себя наследников первой очереди.
136
+ У него есть сестра, которая имеет двоих детей. Кроме того, у Сидорова есть дедушка
137
+ и бабушка по материнской линии. Кто наследует имущество Сидорова, и кто наследует
138
+ по праву представления?
139
+ sentences:
140
+ - <p>1. Одаряемый вправе в любое время до передачи ему дара от него отказаться.
141
+ В этом случае договор дарения считается расторгнутым.</p><p>2. Если договор дарения
142
+ заключен в письменной форме, отказ от дара должен быть совершен также в письменной
143
+ форме. В случае, когда договор дарения зарегистрирован (пункт 3 статьи 574), отказ
144
+ от принятия дара также подлежит государственной регистрации.</p><p>3. Если договор
145
+ дарения был заключен в письменной форме, даритель вправе требовать от одаряемого
146
+ возмещения реального ущерба, причиненного отказом принять дар.</p>
147
+ - <p>1. Если нет наследников первой очереди, наследниками второй очереди по закону
148
+ являются полнородные и неполнородные братья и сестры наследодателя, его дедушка
149
+ и бабушка как со стороны отца, так и со стороны матери.</p><p>2. Дети полнородных
150
+ и неполнородных братьев и сестер наследодателя (племянники и племянницы наследодателя)
151
+ наследуют по праву представления.</p>
152
+ - <p>1. Патент на селекционное достижение может быть признан недействительным в
153
+ течение срока его действия, если будет установлено, что:</p><p>1) патент выдан
154
+ на основании неподтвердившихся данных об однородност�� и о стабильности селекционного
155
+ достижения, представленных заявителем;</p><p>2) на дату выдачи патента селекционное
156
+ достижение не соответствовало критерию новизны или отличимости;</p><p>3) лицо,
157
+ указанное в патенте в качестве патентообладателя, не имело законных оснований
158
+ для получения патента.</p><p>2. Выдача патента на селекционное достижение может
159
+ быть оспорена любым лицом, которому стало известно о нарушениях, предусмотренных
160
+ пунктом 1 настоящей статьи, путем подачи заявления в федеральный орган исполнительной
161
+ власти по селекционным достижениям.</p><p>Федеральный орган исполнительной власти
162
+ по селекционным достижениям направляет копию указанного заявления патентообладателю,
163
+ который в течение трех месяцев со дня направления ему такой копии может представить
164
+ мотивированное возражение.</p><p>Федеральный орган исполнительной власти по селекционным
165
+ достижениям должен принять решение по указанному заявлению в течение шести месяцев
166
+ со дня подачи указанного заявления, если не потребуется проведение дополнительных
167
+ испытаний.</p><p>3. Патент на селекционное достижение, признанный недействительным,
168
+ аннулируется со дня подачи заявки на выдачу патента. При этом лицензионные договоры,
169
+ заключенные до принятия решения о недействительности патента, сохраняют свое действие
170
+ в той мере, в какой они были исполнены к этому дню.</p><p>4. Признание патента
171
+ на селекционное достижение недействительным означает отмену решения федерального
172
+ органа исполнительной власти по селекционным достижениям о выдаче патента (статья
173
+ 1439) и аннулирование соответствующей записи в Государственном реестре охраняемых
174
+ селекционных достижений.</p>
175
+ - source_sentence: Если гражданин, ограниченный в дееспособности из-за психического
176
+ расстройства, совершил сделку, повлекшую имущественные потери, кто несет ответственность
177
+ за причиненный ущерб и на каких основаниях?
178
+ sentences:
179
+ - <p>1. По договору складского хранения товарный склад (хранитель) обязуется за
180
+ вознаграждение хранить товары, переданные ему товаровладельцем (поклажедателем),
181
+ и возвратить эти товары в сохранности.</p><p>Товарным складом признается организация,
182
+ осуществляющая в качестве предпринимательской деятельности хранение товаров и
183
+ оказывающая связанные с хранением услуги.</p><p>2. Письменная форма договора складского
184
+ хранения считается соблюденной, если его заключение и принятие товара на склад
185
+ удостоверены складским документом (статья 912).</p>
186
+ - <p>1. Если договором купли-продажи предусмотрена обязанность продавца передать
187
+ покупателю определенный набор товаров в комплекте (комплект товаров), обязательство
188
+ считается исполненным с момента передачи всех товаров, включенных в комплект.</p><p>2.
189
+ Если иное не предусмотрено договором купли-продажи и не вытекает из су��ества обязательства,
190
+ продавец обязан передать покупателю все товары, входящие в комплект, одновременно.</p>
191
+ - <p>Гражданин, ограниченный судом в дееспособности по основаниям, предусмотренным
192
+ настоящим пунктом, может распоряжаться выплачиваемыми на него алиментами, социальной
193
+ пенсией, возмещением вреда здоровью и в связи со смертью кормильца и иными предоставляемыми
194
+ на его содержание выплатами с письменного согласия попечителя, за исключением
195
+ выплат, которые указаны в подпункте 1 пункта 2 статьи 26 настоящего Кодекса и
196
+ которыми он вправе распоряжаться самостоятельно. Такой гражданин вправе распоряжаться
197
+ указанными выплатами в течение срока, определенного попечителем. Распоряжение
198
+ указанными выплатами может быть прекращено до истечения данного срока по решению
199
+ попечителя.</p><p>При наличии достаточных оснований суд по ходатайству попечителя
200
+ либо органа опеки и попечительства может ограничить или лишить такого гражданина
201
+ права самостоятельно распоряжаться своими доходами, указанными в подпункте 1 пункта
202
+ 2 статьи 26 настоящего Кодекса.</p><p>Гражданин, дееспособность которого ограничена
203
+ вследствие психического расстройства, самостоятельно несет имущественную ответственность
204
+ по сделкам, совершенным им в соответствии с настоящей статьей. За причиненный
205
+ им вред такой гражданин несет ответственность в соответствии с настоящим Кодексом.</p><p>(Пункт
206
+ в редакции Федерального закона <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p><p>3.
207
+ Если основания, в силу которых гражданин был ограничен в дееспособности, отпали,
208
+ суд отменяет ограничение его дееспособности. На основании решения суда отменяется
209
+ установленное над гражданином попечительство.</p><p>Если психическое состояние
210
+ гражданина, который вследствие психического расстройства был в соответствии с
211
+ пунктом 2 настоящей статьи ограничен в дееспособности, изменилось, суд признает
212
+ его недееспособным в соответствии со статьей 29 настоящего Кодекса или отменяет
213
+ ограничение его дееспособности.</p><p>(Дополнение пунктом - Федеральный закон
214
+ <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p>
215
+ pipeline_tag: sentence-similarity
216
+ library_name: sentence-transformers
217
+ metrics:
218
+ - cosine_accuracy@1
219
+ - cosine_accuracy@3
220
+ - cosine_accuracy@5
221
+ - cosine_accuracy@10
222
+ - cosine_precision@1
223
+ - cosine_precision@3
224
+ - cosine_precision@5
225
+ - cosine_precision@10
226
+ - cosine_recall@1
227
+ - cosine_recall@3
228
+ - cosine_recall@5
229
+ - cosine_recall@10
230
+ - cosine_ndcg@10
231
+ - cosine_mrr@10
232
+ - cosine_map@100
233
+ model-index:
234
+ - name: tuned nomic v2
235
+ results:
236
+ - task:
237
+ type: information-retrieval
238
+ name: Information Retrieval
239
+ dataset:
240
+ name: dim 768
241
+ type: dim_768
242
+ metrics:
243
+ - type: cosine_accuracy@1
244
+ value: 0.0068212824010914054
245
+ name: Cosine Accuracy@1
246
+ - type: cosine_accuracy@3
247
+ value: 0.08321964529331514
248
+ name: Cosine Accuracy@3
249
+ - type: cosine_accuracy@5
250
+ value: 0.46248294679399726
251
+ name: Cosine Accuracy@5
252
+ - type: cosine_accuracy@10
253
+ value: 0.7933151432469304
254
+ name: Cosine Accuracy@10
255
+ - type: cosine_precision@1
256
+ value: 0.0068212824010914054
257
+ name: Cosine Precision@1
258
+ - type: cosine_precision@3
259
+ value: 0.027739881764438375
260
+ name: Cosine Precision@3
261
+ - type: cosine_precision@5
262
+ value: 0.09249658935879947
263
+ name: Cosine Precision@5
264
+ - type: cosine_precision@10
265
+ value: 0.07933151432469303
266
+ name: Cosine Precision@10
267
+ - type: cosine_recall@1
268
+ value: 0.0068212824010914054
269
+ name: Cosine Recall@1
270
+ - type: cosine_recall@3
271
+ value: 0.08321964529331514
272
+ name: Cosine Recall@3
273
+ - type: cosine_recall@5
274
+ value: 0.46248294679399726
275
+ name: Cosine Recall@5
276
+ - type: cosine_recall@10
277
+ value: 0.7933151432469304
278
+ name: Cosine Recall@10
279
+ - type: cosine_ndcg@10
280
+ value: 0.31641269883522866
281
+ name: Cosine Ndcg@10
282
+ - type: cosine_mrr@10
283
+ value: 0.1717382359947135
284
+ name: Cosine Mrr@10
285
+ - type: cosine_map@100
286
+ value: 0.18416268406289302
287
+ name: Cosine Map@100
288
+ - task:
289
+ type: information-retrieval
290
+ name: Information Retrieval
291
+ dataset:
292
+ name: dim 512
293
+ type: dim_512
294
+ metrics:
295
+ - type: cosine_accuracy@1
296
+ value: 0.007503410641200546
297
+ name: Cosine Accuracy@1
298
+ - type: cosine_accuracy@3
299
+ value: 0.07366984993178717
300
+ name: Cosine Accuracy@3
301
+ - type: cosine_accuracy@5
302
+ value: 0.4433833560709413
303
+ name: Cosine Accuracy@5
304
+ - type: cosine_accuracy@10
305
+ value: 0.7851296043656207
306
+ name: Cosine Accuracy@10
307
+ - type: cosine_precision@1
308
+ value: 0.007503410641200546
309
+ name: Cosine Precision@1
310
+ - type: cosine_precision@3
311
+ value: 0.02455661664392906
312
+ name: Cosine Precision@3
313
+ - type: cosine_precision@5
314
+ value: 0.08867667121418826
315
+ name: Cosine Precision@5
316
+ - type: cosine_precision@10
317
+ value: 0.07851296043656207
318
+ name: Cosine Precision@10
319
+ - type: cosine_recall@1
320
+ value: 0.007503410641200546
321
+ name: Cosine Recall@1
322
+ - type: cosine_recall@3
323
+ value: 0.07366984993178717
324
+ name: Cosine Recall@3
325
+ - type: cosine_recall@5
326
+ value: 0.4433833560709413
327
+ name: Cosine Recall@5
328
+ - type: cosine_recall@10
329
+ value: 0.7851296043656207
330
+ name: Cosine Recall@10
331
+ - type: cosine_ndcg@10
332
+ value: 0.3120146406417205
333
+ name: Cosine Ndcg@10
334
+ - type: cosine_mrr@10
335
+ value: 0.16864159033326584
336
+ name: Cosine Mrr@10
337
+ - type: cosine_map@100
338
+ value: 0.18144585630264604
339
+ name: Cosine Map@100
340
+ - task:
341
+ type: information-retrieval
342
+ name: Information Retrieval
343
+ dataset:
344
+ name: dim 256
345
+ type: dim_256
346
+ metrics:
347
+ - type: cosine_accuracy@1
348
+ value: 0.0068212824010914054
349
+ name: Cosine Accuracy@1
350
+ - type: cosine_accuracy@3
351
+ value: 0.07503410641200546
352
+ name: Cosine Accuracy@3
353
+ - type: cosine_accuracy@5
354
+ value: 0.422237380627558
355
+ name: Cosine Accuracy@5
356
+ - type: cosine_accuracy@10
357
+ value: 0.7701227830832197
358
+ name: Cosine Accuracy@10
359
+ - type: cosine_precision@1
360
+ value: 0.0068212824010914054
361
+ name: Cosine Precision@1
362
+ - type: cosine_precision@3
363
+ value: 0.02501136880400182
364
+ name: Cosine Precision@3
365
+ - type: cosine_precision@5
366
+ value: 0.0844474761255116
367
+ name: Cosine Precision@5
368
+ - type: cosine_precision@10
369
+ value: 0.07701227830832195
370
+ name: Cosine Precision@10
371
+ - type: cosine_recall@1
372
+ value: 0.0068212824010914054
373
+ name: Cosine Recall@1
374
+ - type: cosine_recall@3
375
+ value: 0.07503410641200546
376
+ name: Cosine Recall@3
377
+ - type: cosine_recall@5
378
+ value: 0.422237380627558
379
+ name: Cosine Recall@5
380
+ - type: cosine_recall@10
381
+ value: 0.7701227830832197
382
+ name: Cosine Recall@10
383
+ - type: cosine_ndcg@10
384
+ value: 0.30479184560913625
385
+ name: Cosine Ndcg@10
386
+ - type: cosine_mrr@10
387
+ value: 0.16402369042205106
388
+ name: Cosine Mrr@10
389
+ - type: cosine_map@100
390
+ value: 0.17692662052162458
391
+ name: Cosine Map@100
392
+ ---
393
+
394
+ # tuned nomic v2
395
+
396
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
397
+
398
+ ## Model Details
399
+
400
+ ### Model Description
401
+ - **Model Type:** Sentence Transformer
402
+ - **Base model:** [nomic-ai/nomic-embed-text-v2-moe](https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe) <!-- at revision 45301cc35fd6988724c4698ee0d97981889ef7a0 -->
403
+ - **Maximum Sequence Length:** 512 tokens
404
+ - **Output Dimensionality:** 768 dimensions
405
+ - **Similarity Function:** Cosine Similarity
406
+ - **Training Dataset:**
407
+ - json
408
+ - **Language:** en
409
+ - **License:** mit
410
+
411
+ ### Model Sources
412
+
413
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
414
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
415
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
416
+
417
+ ### Full Model Architecture
418
+
419
+ ```
420
+ SentenceTransformer(
421
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel
422
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
423
+ (2): Normalize()
424
+ )
425
+ ```
426
+
427
+ ## Usage
428
+
429
+ ### Direct Usage (Sentence Transformers)
430
+
431
+ First install the Sentence Transformers library:
432
+
433
+ ```bash
434
+ pip install -U sentence-transformers
435
+ ```
436
+
437
+ Then you can load this model and run inference.
438
+ ```python
439
+ from sentence_transformers import SentenceTransformer
440
+
441
+ # Download from the 🤗 Hub
442
+ model = SentenceTransformer("DGSMsRzJ6xC2JthtHG9W/nomic-v2-tuned-1")
443
+ # Run inference
444
+ sentences = [
445
+ 'Если гражданин, ограниченный в дееспособности из-за психического расстройства, совершил сделку, повлекшую имущественные потери, кто несет ответственность за причиненный ущерб и на каких основаниях?',
446
+ '<p>Гражданин, ограниченный судом в дееспособности по основаниям, предусмотренным настоящим пунктом, может распоряжаться выплачиваемыми на него алиментами, социальной пенсией, возмещением вреда здоровью и в связи со смертью кормильца и иными предоставляемыми на его содержание выплатами с письменного согласия попечителя, за исключением выплат, которые указаны в подпункте 1 пункта 2 статьи 26 настоящего Кодекса и которыми он вправе распоряжаться самостоятельно. Такой гражданин вправе распоряжаться указанными выплатами в течение срока, определенного попечителем. Распоряжение указанными выплатами может быть прекращено до истечения данного срока по решению попечителя.</p><p>При наличии достаточных оснований суд по ходатайству попечителя либо органа опеки и попечительства может ограничить или лишить такого гражданина права самостоятельно распоряжаться своими доходами, указанными в подпункте 1 пункта 2 статьи 26 настоящего Кодекса.</p><p>Гражданин, дееспособность которого ограничена вследствие психического расстройства, самостоятельно несет имущественную ответственность по сделкам, совершенным им в соответствии с настоящей статьей. За причиненный им вред такой гражданин несет ответственность в соответствии с настоящим Кодексом.</p><p>(Пункт в редакции Федерального закона <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p><p>3. Если основания, в силу которых гражданин был ограничен в дееспособности, отпали, суд отменяет ограничение его дееспособности. На основании решения суда отменяется установленное над гражданином попечительство.</p><p>Если психическое состояние гражданина, который вследствие психического расстройства был в соответствии с пунктом 2 настоящей статьи ограничен в дееспособности, изменилось, суд признает его недееспособным в соответствии со статьей 29 настоящего Кодекса или отменяет ограничение его дееспособности.</p><p>(Дополнение пунктом - Федеральный закон <a href="102162486">от 30.12.2012 № 302-ФЗ</a>)</p>',
447
+ '<p>1. По договору складского хранения товарный склад (хранитель) обязуется за вознаграждение хранить товары, переданные ему товаровладельцем (поклажедателем), и возвратить эти товары в сохранности.</p><p>Товарным складом признается организация, осуществляющая в качестве предпринимательской деятельности хранение товаров и оказывающая связанные с хранением услуги.</p><p>2. Письменная форма договора складского хранения считается соблюденной, если его заключение и принятие товара на склад удостоверены складским документом (статья 912).</p>',
448
+ ]
449
+ embeddings = model.encode(sentences)
450
+ print(embeddings.shape)
451
+ # [3, 768]
452
+
453
+ # Get the similarity scores for the embeddings
454
+ similarities = model.similarity(embeddings, embeddings)
455
+ print(similarities.shape)
456
+ # [3, 3]
457
+ ```
458
+
459
+ <!--
460
+ ### Direct Usage (Transformers)
461
+
462
+ <details><summary>Click to see the direct usage in Transformers</summary>
463
+
464
+ </details>
465
+ -->
466
+
467
+ <!--
468
+ ### Downstream Usage (Sentence Transformers)
469
+
470
+ You can finetune this model on your own dataset.
471
+
472
+ <details><summary>Click to expand</summary>
473
+
474
+ </details>
475
+ -->
476
+
477
+ <!--
478
+ ### Out-of-Scope Use
479
+
480
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
481
+ -->
482
+
483
+ ## Evaluation
484
+
485
+ ### Metrics
486
+
487
+ #### Information Retrieval
488
+
489
+ * Datasets: `dim_768`, `dim_512` and `dim_256`
490
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
491
+
492
+ | Metric | dim_768 | dim_512 | dim_256 |
493
+ |:--------------------|:-----------|:----------|:-----------|
494
+ | cosine_accuracy@1 | 0.0068 | 0.0075 | 0.0068 |
495
+ | cosine_accuracy@3 | 0.0832 | 0.0737 | 0.075 |
496
+ | cosine_accuracy@5 | 0.4625 | 0.4434 | 0.4222 |
497
+ | cosine_accuracy@10 | 0.7933 | 0.7851 | 0.7701 |
498
+ | cosine_precision@1 | 0.0068 | 0.0075 | 0.0068 |
499
+ | cosine_precision@3 | 0.0277 | 0.0246 | 0.025 |
500
+ | cosine_precision@5 | 0.0925 | 0.0887 | 0.0844 |
501
+ | cosine_precision@10 | 0.0793 | 0.0785 | 0.077 |
502
+ | cosine_recall@1 | 0.0068 | 0.0075 | 0.0068 |
503
+ | cosine_recall@3 | 0.0832 | 0.0737 | 0.075 |
504
+ | cosine_recall@5 | 0.4625 | 0.4434 | 0.4222 |
505
+ | cosine_recall@10 | 0.7933 | 0.7851 | 0.7701 |
506
+ | **cosine_ndcg@10** | **0.3164** | **0.312** | **0.3048** |
507
+ | cosine_mrr@10 | 0.1717 | 0.1686 | 0.164 |
508
+ | cosine_map@100 | 0.1842 | 0.1814 | 0.1769 |
509
+
510
+ <!--
511
+ ## Bias, Risks and Limitations
512
+
513
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
514
+ -->
515
+
516
+ <!--
517
+ ### Recommendations
518
+
519
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
520
+ -->
521
+
522
+ ## Training Details
523
+
524
+ ### Training Dataset
525
+
526
+ #### json
527
+
528
+ * Dataset: json
529
+ * Size: 13,186 training samples
530
+ * Columns: <code>anchor</code> and <code>positive</code>
531
+ * Approximate statistics based on the first 1000 samples:
532
+ | | anchor | positive |
533
+ |:--------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
534
+ | type | string | string |
535
+ | details | <ul><li>min: 19 tokens</li><li>mean: 59.74 tokens</li><li>max: 162 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 257.8 tokens</li><li>max: 512 tokens</li></ul> |
536
+ * Samples:
537
+ | anchor | positive |
538
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
539
+ | <code>Предположим, работник должника действовал вопреки указаниям руководства и тем самым причинил ущерб кредитору. Изменит ли это подход к определению ответственности должника?</code> | <code><p>Действия работников должника по исполнению его обязательства считаются действиями должника. Должник отвечает за эти действия, если они повлекли неисполнение или ненадлежащее исполнение обязательства.</p></code> |
540
+ | <code>Композитор Петров заключил договор с аккредитованной организацией «Мелодия» на управление правами на его произведения. Через год Петров решил передать права на управление одной конкретной песней новой организации «Звук». Какие действия должен предпринять Петров, чтобы передать права на управление песней организации «Звук», и какие обязательства при этом возникают у «Мелодии»?</code> | <code><p>Наличие аккредитованной организации не препятствует созданию других организаций по управлению правами на коллективной основе, в том числе в сферах коллективного управления, указанных в пункте 1 настоящей статьи. Такие организации вправе заключать договоры с пользователями только в интересах правообладателей, предоставивших им полномочия по управлению правами в порядке, предусмотренном пунктом 3 статьи 1242 настоящего Кодекса.</p><p>4. Правообладатель, не заключивший с аккредитованной организацией договора о передаче полномочий по управлению правами (пункт 3 настоящей статьи), вправе в любой момент полностью или частично отказаться от управления этой организацией его правами. Правообладатель должен письменно уведомить о своем решении аккредитованную организацию. В случае, если правообладатель намеревается отказаться от управления аккредитованной организацией только частью авторских или смежных прав и (или) объектов этих прав, он должен представить ей перечень таких исключаемых прав и...</code> |
541
+ | <code>Мария получила цифровое право на использование музыкального трека в онлайн-сервисе. Правила сервиса не определяют, кто является обладателем цифрового права в случае смерти пользователя. Мария умерла. Кто будет считаться обладателем цифрового права на музыкальный трек после смерти Марии, согласно тексту статьи?</code> | <code><p>1. Цифровыми правами признаются названные в таком качестве в законе обязательственные и иные права, содержание и условия осуществления которых определяются в соответствии с правилами информационной системы, отвечающей установленным законом признакам. Осуществление, распоряжение, в том числе передача, залог, обременение цифрового права другими способами или ограничение распоряжения цифровым правом возможны только в информационной системе без обращения к третьему лицу.</p><p>2. Если иное не предусмотрено законом, обладателем цифрового права признается лицо, которое в соответствии с правилами информационной системы имеет возможность распоряжаться этим правом. В случаях и по основаниям, которые предусмотрены законом, обладателем цифрового права признается иное лицо.</p><p>3. Переход цифрового права на основании сделки не требует согласия лица, обязанного по такому цифровому праву.</p><p>(Дополнение статьей - Федеральный закон <a href="102528600">от 18.03.2019 № 34-ФЗ</a>)</p></code> |
542
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
543
+ ```json
544
+ {
545
+ "loss": "MultipleNegativesRankingLoss",
546
+ "matryoshka_dims": [
547
+ 768,
548
+ 512,
549
+ 256
550
+ ],
551
+ "matryoshka_weights": [
552
+ 1,
553
+ 1,
554
+ 1
555
+ ],
556
+ "n_dims_per_step": -1
557
+ }
558
+ ```
559
+
560
+ ### Training Hyperparameters
561
+ #### Non-Default Hyperparameters
562
+
563
+ - `eval_strategy`: epoch
564
+ - `per_device_train_batch_size`: 32
565
+ - `per_device_eval_batch_size`: 16
566
+ - `gradient_accumulation_steps`: 16
567
+ - `learning_rate`: 2e-05
568
+ - `num_train_epochs`: 4
569
+ - `lr_scheduler_type`: cosine
570
+ - `warmup_ratio`: 0.1
571
+ - `bf16`: True
572
+ - `tf32`: True
573
+ - `load_best_model_at_end`: True
574
+ - `optim`: adamw_torch_fused
575
+ - `batch_sampler`: no_duplicates
576
+
577
+ #### All Hyperparameters
578
+ <details><summary>Click to expand</summary>
579
+
580
+ - `overwrite_output_dir`: False
581
+ - `do_predict`: False
582
+ - `eval_strategy`: epoch
583
+ - `prediction_loss_only`: True
584
+ - `per_device_train_batch_size`: 32
585
+ - `per_device_eval_batch_size`: 16
586
+ - `per_gpu_train_batch_size`: None
587
+ - `per_gpu_eval_batch_size`: None
588
+ - `gradient_accumulation_steps`: 16
589
+ - `eval_accumulation_steps`: None
590
+ - `torch_empty_cache_steps`: None
591
+ - `learning_rate`: 2e-05
592
+ - `weight_decay`: 0.0
593
+ - `adam_beta1`: 0.9
594
+ - `adam_beta2`: 0.999
595
+ - `adam_epsilon`: 1e-08
596
+ - `max_grad_norm`: 1.0
597
+ - `num_train_epochs`: 4
598
+ - `max_steps`: -1
599
+ - `lr_scheduler_type`: cosine
600
+ - `lr_scheduler_kwargs`: {}
601
+ - `warmup_ratio`: 0.1
602
+ - `warmup_steps`: 0
603
+ - `log_level`: passive
604
+ - `log_level_replica`: warning
605
+ - `log_on_each_node`: True
606
+ - `logging_nan_inf_filter`: True
607
+ - `save_safetensors`: True
608
+ - `save_on_each_node`: False
609
+ - `save_only_model`: False
610
+ - `restore_callback_states_from_checkpoint`: False
611
+ - `no_cuda`: False
612
+ - `use_cpu`: False
613
+ - `use_mps_device`: False
614
+ - `seed`: 42
615
+ - `data_seed`: None
616
+ - `jit_mode_eval`: False
617
+ - `use_ipex`: False
618
+ - `bf16`: True
619
+ - `fp16`: False
620
+ - `fp16_opt_level`: O1
621
+ - `half_precision_backend`: auto
622
+ - `bf16_full_eval`: False
623
+ - `fp16_full_eval`: False
624
+ - `tf32`: True
625
+ - `local_rank`: 0
626
+ - `ddp_backend`: None
627
+ - `tpu_num_cores`: None
628
+ - `tpu_metrics_debug`: False
629
+ - `debug`: []
630
+ - `dataloader_drop_last`: False
631
+ - `dataloader_num_workers`: 0
632
+ - `dataloader_prefetch_factor`: None
633
+ - `past_index`: -1
634
+ - `disable_tqdm`: False
635
+ - `remove_unused_columns`: True
636
+ - `label_names`: None
637
+ - `load_best_model_at_end`: True
638
+ - `ignore_data_skip`: False
639
+ - `fsdp`: []
640
+ - `fsdp_min_num_params`: 0
641
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
642
+ - `fsdp_transformer_layer_cls_to_wrap`: None
643
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
644
+ - `deepspeed`: None
645
+ - `label_smoothing_factor`: 0.0
646
+ - `optim`: adamw_torch_fused
647
+ - `optim_args`: None
648
+ - `adafactor`: False
649
+ - `group_by_length`: False
650
+ - `length_column_name`: length
651
+ - `ddp_find_unused_parameters`: None
652
+ - `ddp_bucket_cap_mb`: None
653
+ - `ddp_broadcast_buffers`: False
654
+ - `dataloader_pin_memory`: True
655
+ - `dataloader_persistent_workers`: False
656
+ - `skip_memory_metrics`: True
657
+ - `use_legacy_prediction_loop`: False
658
+ - `push_to_hub`: False
659
+ - `resume_from_checkpoint`: None
660
+ - `hub_model_id`: None
661
+ - `hub_strategy`: every_save
662
+ - `hub_private_repo`: False
663
+ - `hub_always_push`: False
664
+ - `gradient_checkpointing`: False
665
+ - `gradient_checkpointing_kwargs`: None
666
+ - `include_inputs_for_metrics`: False
667
+ - `eval_do_concat_batches`: True
668
+ - `fp16_backend`: auto
669
+ - `push_to_hub_model_id`: None
670
+ - `push_to_hub_organization`: None
671
+ - `mp_parameters`:
672
+ - `auto_find_batch_size`: False
673
+ - `full_determinism`: False
674
+ - `torchdynamo`: None
675
+ - `ray_scope`: last
676
+ - `ddp_timeout`: 1800
677
+ - `torch_compile`: False
678
+ - `torch_compile_backend`: None
679
+ - `torch_compile_mode`: None
680
+ - `dispatch_batches`: None
681
+ - `split_batches`: None
682
+ - `include_tokens_per_second`: False
683
+ - `include_num_input_tokens_seen`: False
684
+ - `neftune_noise_alpha`: None
685
+ - `optim_target_modules`: None
686
+ - `batch_eval_metrics`: False
687
+ - `eval_on_start`: False
688
+ - `eval_use_gather_object`: False
689
+ - `prompts`: None
690
+ - `batch_sampler`: no_duplicates
691
+ - `multi_dataset_batch_sampler`: proportional
692
+
693
+ </details>
694
+
695
+ ### Training Logs
696
+ | Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 |
697
+ |:----------:|:-------:|:-------------:|:----------------------:|:----------------------:|:----------------------:|
698
+ | 0.3874 | 10 | 0.7904 | - | - | - |
699
+ | 0.7748 | 20 | 0.3376 | - | - | - |
700
+ | 0.9685 | 25 | - | 0.3066 | 0.3046 | 0.2903 |
701
+ | 1.1622 | 30 | 0.2443 | - | - | - |
702
+ | 1.5496 | 40 | 0.1593 | - | - | - |
703
+ | 1.9370 | 50 | 0.1378 | - | - | - |
704
+ | 1.9758 | 51 | - | 0.3164 | 0.3133 | 0.3031 |
705
+ | 2.3245 | 60 | 0.1064 | - | - | - |
706
+ | 2.7119 | 70 | 0.0956 | - | - | - |
707
+ | 2.9831 | 77 | - | 0.3159 | 0.3141 | 0.3034 |
708
+ | 3.0993 | 80 | 0.0915 | - | - | - |
709
+ | 3.4867 | 90 | 0.0847 | - | - | - |
710
+ | **3.8741** | **100** | **0.0885** | **0.3164** | **0.312** | **0.3048** |
711
+
712
+ * The bold row denotes the saved checkpoint.
713
+
714
+ ### Framework Versions
715
+ - Python: 3.11.11
716
+ - Sentence Transformers: 3.4.1
717
+ - Transformers: 4.43.0
718
+ - PyTorch: 2.6.0+cu124
719
+ - Accelerate: 1.3.0
720
+ - Datasets: 3.3.2
721
+ - Tokenizers: 0.19.1
722
+
723
+ ## Citation
724
+
725
+ ### BibTeX
726
+
727
+ #### Sentence Transformers
728
+ ```bibtex
729
+ @inproceedings{reimers-2019-sentence-bert,
730
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
731
+ author = "Reimers, Nils and Gurevych, Iryna",
732
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
733
+ month = "11",
734
+ year = "2019",
735
+ publisher = "Association for Computational Linguistics",
736
+ url = "https://arxiv.org/abs/1908.10084",
737
+ }
738
+ ```
739
+
740
+ #### MatryoshkaLoss
741
+ ```bibtex
742
+ @misc{kusupati2024matryoshka,
743
+ title={Matryoshka Representation Learning},
744
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
745
+ year={2024},
746
+ eprint={2205.13147},
747
+ archivePrefix={arXiv},
748
+ primaryClass={cs.LG}
749
+ }
750
+ ```
751
+
752
+ #### MultipleNegativesRankingLoss
753
+ ```bibtex
754
+ @misc{henderson2017efficient,
755
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
756
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
757
+ year={2017},
758
+ eprint={1705.00652},
759
+ archivePrefix={arXiv},
760
+ primaryClass={cs.CL}
761
+ }
762
+ ```
763
+
764
+ <!--
765
+ ## Glossary
766
+
767
+ *Clearly define terms in order to be accessible across audiences.*
768
+ -->
769
+
770
+ <!--
771
+ ## Model Card Authors
772
+
773
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
774
+ -->
775
+
776
+ <!--
777
+ ## Model Card Contact
778
+
779
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
780
+ -->
config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v2-moe",
3
+ "activation_function": "gelu",
4
+ "add_pooling_layer": false,
5
+ "architectures": [
6
+ "NomicBertModel"
7
+ ],
8
+ "attn_pdrop": 0.0,
9
+ "auto_map": {
10
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
11
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
12
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining",
13
+ "AutoModelForMultipleChoice": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForMultipleChoice",
14
+ "AutoModelForQuestionAnswering": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForQuestionAnswering",
15
+ "AutoModelForSequenceClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForSequenceClassification",
16
+ "AutoModelForTokenClassification": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForTokenClassification"
17
+ },
18
+ "bos_token_id": null,
19
+ "causal": false,
20
+ "dense_seq_output": true,
21
+ "embd_pdrop": 0.1,
22
+ "eos_token_id": null,
23
+ "expert_choice_router": false,
24
+ "ffn_div": 1,
25
+ "fused_bias_fc": true,
26
+ "fused_dropout_add_ln": true,
27
+ "initializer_range": 0.02,
28
+ "layer_norm_epsilon": 1e-05,
29
+ "max_trained_positions": 2048,
30
+ "mlp_fc1_bias": true,
31
+ "mlp_fc2_bias": true,
32
+ "model_type": "nomic_bert",
33
+ "moe_every_n_layers": 2,
34
+ "moe_impl": "megablocks",
35
+ "moe_normalize_expert_weights": false,
36
+ "moe_resid_pdrop": 0.0,
37
+ "moe_top_k": 2,
38
+ "n_embd": 768,
39
+ "n_head": 12,
40
+ "n_inner": 3072,
41
+ "n_layer": 12,
42
+ "n_positions": 2048,
43
+ "num_experts": 8,
44
+ "num_shared_experts": 0,
45
+ "pad_token_id": 1,
46
+ "pad_vocab_size_multiple": 64,
47
+ "parallel_block": false,
48
+ "parallel_block_tied_norm": false,
49
+ "prenorm": false,
50
+ "qkv_proj_bias": true,
51
+ "reorder_and_upcast_attn": false,
52
+ "resid_pdrop": 0.0,
53
+ "rotary_emb_base": 10000,
54
+ "rotary_emb_fraction": 1.0,
55
+ "rotary_emb_interleaved": false,
56
+ "rotary_emb_scale_base": null,
57
+ "rotary_scaling_factor": null,
58
+ "router_aux_loss_coef": 0.1,
59
+ "scale_attn_by_inverse_layer_idx": false,
60
+ "scale_attn_weights": true,
61
+ "summary_activation": null,
62
+ "summary_first_dropout": 0.1,
63
+ "summary_proj_to_labels": true,
64
+ "summary_type": "cls_index",
65
+ "summary_use_proj": true,
66
+ "torch_dtype": "float32",
67
+ "transformers_version": "4.43.0",
68
+ "type_vocab_size": 1,
69
+ "use_cache": true,
70
+ "use_flash_attn": true,
71
+ "use_rms_norm": null,
72
+ "use_xentropy": true,
73
+ "vocab_size": 250048
74
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.4.1",
4
+ "transformers": "4.43.0",
5
+ "pytorch": "2.6.0+cu124"
6
+ },
7
+ "prompts": {
8
+ "query": "search_query: ",
9
+ "passage": "search_document: ",
10
+ "Classification": "classification: ",
11
+ "MultilabelClassification": "classification: ",
12
+ "Clustering": "clustering: ",
13
+ "PairClassification": "classification: ",
14
+ "STS": "classification: ",
15
+ "Summarization": "classification: ",
16
+ "Speed": "search_document: "
17
+ },
18
+ "default_prompt_name": null,
19
+ "similarity_fn_name": "cosine"
20
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f2fa79171794a0e911be96ca7c3b21808bf57acb973a0e1407496b88f9d8a501
3
+ size 1901187232
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 512,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "XLMRobertaTokenizer",
53
+ "unk_token": "<unk>"
54
+ }