{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "provenance": [], "machine_shape": "hm", "gpuType": "A100" }, "kernelspec": { "name": "python3", "display_name": "Python 3" }, "language_info": { "name": "python" }, "accelerator": "GPU", "widgets": { "application/vnd.jupyter.widget-state+json": { "2daf4bced26548a6bf8319f5f7e274c4": { "model_module": "@jupyter-widgets/controls", "model_name": "VBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "VBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "VBoxView", "box_style": "", "children": [ "IPY_MODEL_c0df28e87bb148a3bb0e86be0782411b", "IPY_MODEL_fa7f5d29f6af43c6a53ed241befb9c2c", "IPY_MODEL_b9d0b58707e84e9e9f096441f067f544", "IPY_MODEL_129eb9f545314ca3ac474462e331e22e", "IPY_MODEL_4f8c02cb22df4f8999efa2f17ae0ebed" ], "layout": "IPY_MODEL_91846047b296465fb9291e579a131a87" } }, "c0df28e87bb148a3bb0e86be0782411b": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_ffaebd71bf87461693949cdc6e5c1d24", "placeholder": "", "style": "IPY_MODEL_7c5f4bb5dc494b2db921b022a0183554", "value": "
| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "'Цукор - біла смерть' Дебати щодо шкоди цукру ... | \n", "881 | \n", "6094 | \n", "597 | \n", "'Цукор - біла смерть' Дебати щодо шкоди цукру ... | \n", "661 | \n", "4530 | \n", "
| 1 | \n", "UKR | \n", "Aya-23 | \n", "Partial | \n", "Test | \n", "З цього парадоксу випадають екзит-поли, адже з... | \n", "111 | \n", "756 | \n", "68 | \n", "З цього парадоксу випадають екзит-поли, адже з... | \n", "86 | \n", "594 | \n", "
| 2 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Train | \n", "Вивезені лордом Елгіним скульптури Парфенону в... | \n", "430 | \n", "3128 | \n", "276 | \n", "Вивезені лордом Елгіним скульптури Парфенону в... | \n", "312 | \n", "2270 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "- Я уважно слідкую за цими подіями за пресою т... | \n", "73 | \n", "426 | \n", "35 | \n", "- Я уважно слідкую за цими подіями за пресою т... | \n", "73 | \n", "471 | \n", "
| 4 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Unchanged | \n", "Test | \n", "- Наш виторг цього року навіть трохи менший, а... | \n", "50 | \n", "319 | \n", "50 | \n", "- Наш виторг цього року навіть трохи менший, а... | \n", "50 | \n", "319 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 99920 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Train | \n", "— Перше і найголовніше — це 220 робочих місць,... | \n", "108 | \n", "755 | \n", "32 | \n", "— Перше і найголовніше — це 220 робочих місць,... | \n", "76 | \n", "545 | \n", "
| 99921 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Train | \n", "Та це лише офіційні цифри, багато хто мовчить ... | \n", "66 | \n", "425 | \n", "46 | \n", "Та це лише офіційні цифри, багато хто мовчить ... | \n", "124 | \n", "847 | \n", "
| 99922 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Train | \n", "1. На українські землі масонство із Західної Є... | \n", "32 | \n", "208 | \n", "17 | \n", "1 . На українські землі масонство із Західної ... | \n", "159 | \n", "1134 | \n", "
| 99923 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "'Уряд намагався не помічати кризи до того часу... | \n", "68 | \n", "493 | \n", "52 | \n", "'Уряд намагався не помічати кризи до того часу... | \n", "151 | \n", "1045 | \n", "
| 99924 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Проводять вигонку в дерев’яних ящиках чи спеці... | \n", "56 | \n", "371 | \n", "38 | \n", "Проводять вигонку в дерев’яних ящиках чи спеці... | \n", "111 | \n", "739 | \n", "
99925 rows × 11 columns
\n", "| \n", " | id | \n", "label | \n", "
|---|---|---|
| 0 | \n", "UKR2 | \n", "81 | \n", "
| 1 | \n", "UKR3 | \n", "0 | \n", "
| 2 | \n", "UKR4 | \n", "322 | \n", "
| 3 | \n", "UKR7 | \n", "24 | \n", "
| 4 | \n", "UKR8 | \n", "42 | \n", "
| ... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR99919 | \n", "26 | \n", "
| 49952 | \n", "UKR99921 | \n", "55 | \n", "
| 49953 | \n", "UKR99922 | \n", "75 | \n", "
| 49954 | \n", "UKR99923 | \n", "31 | \n", "
| 49955 | \n", "UKR99924 | \n", "18 | \n", "
49956 rows × 2 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "label | \n", "text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "1248 | \n", "UKR2 | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "555 | \n", "UKR3 | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "2535 | \n", "UKR4 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "3541 | \n", "UKR7 | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "737 | \n", "UKR8 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "574 | \n", "UKR99919 | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "797 | \n", "UKR99921 | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "UKR99922 | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "623 | \n", "UKR99923 | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "523 | \n", "UKR99924 | \n", "
49956 rows × 12 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "
|---|---|---|---|---|
| 0 | \n", "UKR2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "
| 1 | \n", "UKR3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "
| 2 | \n", "UKR4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "
| 3 | \n", "UKR7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "
| 4 | \n", "UKR8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "
| 49952 | \n", "UKR99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "
| 49953 | \n", "UKR99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "
| 49954 | \n", "UKR99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "
| 49955 | \n", "UKR99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "
49956 rows × 4 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|
| 0 | \n", "UKR2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "
| 1 | \n", "UKR3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "UKR4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "
| 3 | \n", "UKR7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "
| 4 | \n", "UKR8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "
| 49952 | \n", "UKR99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "
| 49953 | \n", "UKR99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "
| 49954 | \n", "UKR99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "
| 49955 | \n", "UKR99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "
49956 rows × 5 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|
| 0 | \n", "2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "
| 1 | \n", "3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "
| 3 | \n", "7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "
| 4 | \n", "8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "
| 49952 | \n", "99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "
| 49953 | \n", "99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "
| 49954 | \n", "99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "
| 49955 | \n", "99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "
49956 rows × 5 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "1248 | \n", "2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "555 | \n", "3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "2535 | \n", "4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "3541 | \n", "7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "737 | \n", "8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "574 | \n", "99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "797 | \n", "99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "623 | \n", "99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "523 | \n", "99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "
49956 rows × 16 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "1248 | \n", "2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "Inside | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "555 | \n", "3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "Inside | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "2535 | \n", "4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "Inside | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "3541 | \n", "7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "Inside | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "737 | \n", "8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "Inside | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "574 | \n", "99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "Inside | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "797 | \n", "99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "Inside | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "Inside | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "623 | \n", "99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "Inside | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "523 | \n", "99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "Inside | \n", "
49956 rows × 17 columns
\n", "| \n", " | count | \n", "
|---|---|
| Token Limit Check | \n", "\n", " |
| Inside | \n", "49696 | \n", "
| Outside | \n", "260 | \n", "
| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "1248 | \n", "2 | \n", "81 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "555 | \n", "3 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "2535 | \n", "4 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "3541 | \n", "7 | \n", "24 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "737 | \n", "8 | \n", "42 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "574 | \n", "99919 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "797 | \n", "99921 | \n", "55 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "99922 | \n", "75 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "623 | \n", "99923 | \n", "31 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "523 | \n", "99924 | \n", "18 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
49956 rows × 19 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "... | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "80 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "90 | \n", "0 | \n", "80 | \n", "1 | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "... | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "94 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "... | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "322 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "46 | \n", "0 | \n", "322 | \n", "0 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "... | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "541 | \n", "517 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "45 | \n", "517 | \n", "24 | \n", "0 | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "... | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "39 | \n", "3 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "76 | \n", "0 | \n", "39 | \n", "3 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "... | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "26 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "67 | \n", "0 | \n", "26 | \n", "0 | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "... | \n", "У верхній частині турнірної таблиці нині переб... | \n", "56 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "59 | \n", "1 | \n", "55 | \n", "0 | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "... | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "1 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "0 | \n", "1 | \n", "75 | \n", "0 | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "... | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "24 | \n", "7 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "57 | \n", "0 | \n", "24 | \n", "7 | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "... | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "20 | \n", "2 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "52 | \n", "2 | \n", "18 | \n", "0 | \n", "
49956 rows × 23 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "ROW_ACC | \n", "ROW_PREC | \n", "ROW_REC | \n", "ROW_F1 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "90 | \n", "0 | \n", "80 | \n", "1 | \n", "0.994152 | \n", "1.000000 | \n", "0.989011 | \n", "0.994475 | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "94 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "46 | \n", "0 | \n", "322 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "45 | \n", "517 | \n", "24 | \n", "0 | \n", "0.117747 | \n", "0.080071 | \n", "1.000000 | \n", "0.148270 | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "76 | \n", "0 | \n", "39 | \n", "3 | \n", "0.974576 | \n", "1.000000 | \n", "0.962025 | \n", "0.980645 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "67 | \n", "0 | \n", "26 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "59 | \n", "1 | \n", "55 | \n", "0 | \n", "0.991304 | \n", "0.983333 | \n", "1.000000 | \n", "0.991597 | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "0 | \n", "1 | \n", "75 | \n", "0 | \n", "0.986842 | \n", "0.000000 | \n", "0.000000 | \n", "0.000000 | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "57 | \n", "0 | \n", "24 | \n", "7 | \n", "0.920455 | \n", "1.000000 | \n", "0.890625 | \n", "0.942149 | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "52 | \n", "2 | \n", "18 | \n", "0 | \n", "0.972222 | \n", "0.962963 | \n", "1.000000 | \n", "0.981132 | \n", "
49956 rows × 27 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "ROW_ACC | \n", "ROW_PREC | \n", "ROW_REC | \n", "ROW_F1 | \n", "Label : 1 | \n", "Label : 0 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "UKR | \n", "GPT-o1 | \n", "Partial | \n", "Test | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "136 | \n", "955 | \n", "80 | \n", "Про це заявив заступник начальника Генштабу ЗС... | \n", "171 | \n", "... | \n", "90 | \n", "0 | \n", "80 | \n", "1 | \n", "0.994152 | \n", "1.000000 | \n", "0.989011 | \n", "0.994475 | \n", "0.526316 | \n", "0.473684 | \n", "
| 1 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Rewritten | \n", "Test | \n", "“Поїду, а коли настануть кращі часи, повернусь... | \n", "106 | \n", "650 | \n", "0 | \n", "Наступного дня дискусія щодо заробітків продов... | \n", "94 | \n", "... | \n", "94 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "0.000000 | \n", "
| 2 | \n", "UKR | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "555 | \n", "3873 | \n", "322 | \n", "Ху Цзіньтао виступає перед делегатами з'їзду, ... | \n", "368 | \n", "... | \n", "46 | \n", "0 | \n", "322 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "0.125000 | \n", "0.875000 | \n", "
| 3 | \n", "UKR | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "1239 | \n", "7660 | \n", "541 | \n", "У мене є таємниця. Від людини, якій я розповід... | \n", "586 | \n", "... | \n", "45 | \n", "517 | \n", "24 | \n", "0 | \n", "0.117747 | \n", "0.080071 | \n", "1.000000 | \n", "0.148270 | \n", "0.959044 | \n", "0.040956 | \n", "
| 4 | \n", "UKR | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "109 | \n", "649 | \n", "39 | \n", "– Цього року у нас були не тільки жителі Вінни... | \n", "118 | \n", "... | \n", "76 | \n", "0 | \n", "39 | \n", "3 | \n", "0.974576 | \n", "1.000000 | \n", "0.962025 | \n", "0.980645 | \n", "0.644068 | \n", "0.355932 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49951 | \n", "UKR | \n", "Gemini-Pro-1.5 | \n", "Partial | \n", "Test | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "68 | \n", "426 | \n", "26 | \n", "Вільне життя, на превеликий подив мурчика, на ... | \n", "93 | \n", "... | \n", "67 | \n", "0 | \n", "26 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "1.000000 | \n", "0.720430 | \n", "0.279570 | \n", "
| 49952 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У верхній частині турнірної таблиці нині переб... | \n", "99 | \n", "616 | \n", "56 | \n", "У верхній частині турнірної таблиці нині переб... | \n", "115 | \n", "... | \n", "59 | \n", "1 | \n", "55 | \n", "0 | \n", "0.991304 | \n", "0.983333 | \n", "1.000000 | \n", "0.991597 | \n", "0.521739 | \n", "0.478261 | \n", "
| 49953 | \n", "UKR | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "595 | \n", "76 | \n", "Саме тому австрійське командування й намагалос... | \n", "76 | \n", "... | \n", "0 | \n", "1 | \n", "75 | \n", "0 | \n", "0.986842 | \n", "0.000000 | \n", "0.000000 | \n", "0.000000 | \n", "0.013158 | \n", "0.986842 | \n", "
| 49954 | \n", "UKR | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "81 | \n", "622 | \n", "24 | \n", "У штабі наголосили, що бойовики посилили обстр... | \n", "88 | \n", "... | \n", "57 | \n", "0 | \n", "24 | \n", "7 | \n", "0.920455 | \n", "1.000000 | \n", "0.890625 | \n", "0.942149 | \n", "0.647727 | \n", "0.352273 | \n", "
| 49955 | \n", "UKR | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Test | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "46 | \n", "287 | \n", "20 | \n", "Чим же ж має бути такий громадянський іспит? П... | \n", "72 | \n", "... | \n", "52 | \n", "2 | \n", "18 | \n", "0 | \n", "0.972222 | \n", "0.962963 | \n", "1.000000 | \n", "0.981132 | \n", "0.750000 | \n", "0.250000 | \n", "
49956 rows × 29 columns
\n", "