{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "provenance": [], "machine_shape": "hm", "gpuType": "A100" }, "kernelspec": { "name": "python3", "display_name": "Python 3" }, "language_info": { "name": "python" }, "accelerator": "GPU", "widgets": { "application/vnd.jupyter.widget-state+json": { "21330d77a6544f1aacf16e3d6608dab5": { "model_module": "@jupyter-widgets/controls", "model_name": "VBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "VBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "VBoxView", "box_style": "", "children": [], "layout": "IPY_MODEL_1bbdbe20067e4286825c547ddd8fd7ac" } }, "56221ae606894685b38769e2963c7e74": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_394ccc1b0b9f4c0fbf76e8b9488da9b2", "placeholder": "", "style": "IPY_MODEL_69df7b96610f4cbfaf170db215dceae6", "value": "
| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Partial | \n", "Test | \n", "việc riêng tư nhất từ cuộc sống cách đây hàng ... | \n", "72 | \n", "313 | \n", "22 | \n", "việc riêng tư nhất từ cuộc sống cách đây hàng ... | \n", "89 | \n", "409 | \n", "
| 1 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Chốt phiên, chỉ số Dow Jones Industrial lấy lạ... | \n", "98 | \n", "478 | \n", "65 | \n", "Chốt phiên, chỉ số Dow Jones Industrial lấy lạ... | \n", "135 | \n", "645 | \n", "
| 2 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Dev | \n", "Rõ ràng, Buffett, nhà đầu tư được tôn sùng nhấ... | \n", "76 | \n", "350 | \n", "32 | \n", "Rõ ràng, Buffett, nhà đầu tư được tôn sùng nhấ... | \n", "124 | \n", "555 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Các triệu chứng đầu tiên xuất hiện trong vòng ... | \n", "74 | \n", "344 | \n", "37 | \n", "Các triệu chứng đầu tiên xuất hiện trong vòng ... | \n", "96 | \n", "437 | \n", "
| 4 | \n", "VIE | \n", "Mistral-Large-2411 | \n", "Rewritten | \n", "Train | \n", "Cổ động viên Anh Thành công ngoài kỳ vọng Dưới... | \n", "601 | \n", "2727 | \n", "0 | \n", "**Cập nhật ngày hôm sau:**\\n\\nSau trận bán kết... | \n", "66 | \n", "305 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 99924 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bạn chớ nên bị nhập nhằng giữa sự nghe và thấu... | \n", "99 | \n", "443 | \n", "52 | \n", "Bạn chớ nên bị nhập nhằng giữa sự nghe và thấu... | \n", "155 | \n", "686 | \n", "
| 99925 | \n", "VIE | \n", "GPT-o1 | \n", "Partial | \n", "Train | \n", "Ðứng về phương diện chung, không có nền văn hó... | \n", "74 | \n", "329 | \n", "64 | \n", "Ðứng về phương diện chung , không có nền văn h... | \n", "195 | \n", "854 | \n", "
| 99926 | \n", "VIE | \n", "Mistral-Large-2411 | \n", "Partial | \n", "Train | \n", "Ban Chăm sóc Sức khỏe Trung ương dự kiến sẽ hộ... | \n", "826 | \n", "3803 | \n", "281 | \n", "Ban Chăm sóc Sức khỏe Trung ương dự kiến sẽ hộ... | \n", "329 | \n", "1521 | \n", "
| 99927 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Train | \n", "Xnote Z330 cấu hình thấp nhất (giá 1.500 USD) ... | \n", "71 | \n", "318 | \n", "32 | \n", "Xnote Z330 cấu hình thấp nhất (giá 1.500 USD) ... | \n", "117 | \n", "524 | \n", "
| 99928 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Rewritten | \n", "Test | \n", "- Hằng tháng, các ngân hàng đều có báo cáo gửi... | \n", "75 | \n", "325 | \n", "0 | \n", "- Hôm qua, các ngân hàng tiếp tục gửi báo cáo ... | \n", "92 | \n", "396 | \n", "
99929 rows × 11 columns
\n", "| \n", " | id | \n", "label | \n", "
|---|---|---|
| 0 | \n", "VIE2 | \n", "0 | \n", "
| 1 | \n", "VIE4 | \n", "0 | \n", "
| 2 | \n", "VIE5 | \n", "201 | \n", "
| 3 | \n", "VIE7 | \n", "789 | \n", "
| 4 | \n", "VIE11 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE99923 | \n", "20 | \n", "
| 49959 | \n", "VIE99924 | \n", "39 | \n", "
| 49960 | \n", "VIE99925 | \n", "36 | \n", "
| 49961 | \n", "VIE99927 | \n", "431 | \n", "
| 49962 | \n", "VIE99928 | \n", "140 | \n", "
49963 rows × 2 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "label | \n", "text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "292 | \n", "VIE2 | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "407 | \n", "VIE4 | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "1264 | \n", "VIE5 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "3916 | \n", "VIE7 | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "369 | \n", "VIE11 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "298 | \n", "VIE99923 | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "695 | \n", "VIE99924 | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "657 | \n", "VIE99925 | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "2535 | \n", "VIE99927 | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "VIE99928 | \n", "
49963 rows × 12 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "
|---|---|---|---|---|
| 0 | \n", "VIE2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "
| 1 | \n", "VIE4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "
| 2 | \n", "VIE5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "
| 3 | \n", "VIE7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "
| 4 | \n", "VIE11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "
| 49959 | \n", "VIE99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "
| 49960 | \n", "VIE99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "
| 49961 | \n", "VIE99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "
| 49962 | \n", "VIE99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "
49963 rows × 4 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|
| 0 | \n", "VIE2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "
| 1 | \n", "VIE4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "VIE5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "
| 3 | \n", "VIE7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "
| 4 | \n", "VIE11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "
| 49959 | \n", "VIE99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "
| 49960 | \n", "VIE99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "
| 49961 | \n", "VIE99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "
| 49962 | \n", "VIE99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "
49963 rows × 5 columns
\n", "| \n", " | id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|
| 0 | \n", "2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "
| 1 | \n", "4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "
| 3 | \n", "7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "
| 4 | \n", "11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "
| 49959 | \n", "99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "
| 49960 | \n", "99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "
| 49961 | \n", "99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "
| 49962 | \n", "99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "
49963 rows × 5 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "292 | \n", "2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "407 | \n", "4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "1264 | \n", "5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "3916 | \n", "7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "369 | \n", "11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "298 | \n", "99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "695 | \n", "99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "657 | \n", "99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "2535 | \n", "99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "
49963 rows × 16 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "292 | \n", "2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "Inside | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "407 | \n", "4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "Inside | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "1264 | \n", "5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "Inside | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "3916 | \n", "7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "Inside | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "369 | \n", "11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "Inside | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "298 | \n", "99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "Inside | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "695 | \n", "99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "Inside | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "657 | \n", "99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "Inside | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "2535 | \n", "99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "Inside | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "Inside | \n", "
49963 rows × 17 columns
\n", "| \n", " | count | \n", "
|---|---|
| Token Limit Check | \n", "\n", " |
| Inside | \n", "49449 | \n", "
| Outside | \n", "514 | \n", "
| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "New Char Count | \n", "id | \n", "label_pred | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "292 | \n", "2 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "407 | \n", "4 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "1264 | \n", "5 | \n", "201 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "3916 | \n", "7 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "369 | \n", "11 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "298 | \n", "99923 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "695 | \n", "99924 | \n", "39 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "657 | \n", "99925 | \n", "36 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "2535 | \n", "99927 | \n", "431 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "99928 | \n", "140 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "
49963 rows × 19 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "text | \n", "label_gold | \n", "diff | \n", "Token Limit Check | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "... | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "68 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "... | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "90 | \n", "0 | \n", "0 | \n", "0 | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "... | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "210 | \n", "9 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "72 | \n", "9 | \n", "201 | \n", "0 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "... | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "789 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "58 | \n", "0 | \n", "789 | \n", "0 | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "... | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "0 | \n", "0 | \n", "Inside | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "83 | \n", "0 | \n", "0 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "... | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "20 | \n", "0 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "49 | \n", "0 | \n", "20 | \n", "0 | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "... | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "65 | \n", "26 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "88 | \n", "26 | \n", "39 | \n", "0 | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "... | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "43 | \n", "7 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "101 | \n", "7 | \n", "36 | \n", "0 | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "... | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "460 | \n", "29 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "102 | \n", "29 | \n", "431 | \n", "0 | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "... | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "68 | \n", "Inside | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "0 | \n", "68 | \n", "140 | \n", "0 | \n", "
49963 rows × 23 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "WORDS_REAL | \n", "WORDS_PRED | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "ROW_ACC | \n", "ROW_PREC | \n", "ROW_REC | \n", "ROW_F1 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "68 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "90 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "72 | \n", "9 | \n", "201 | \n", "0 | \n", "0.968085 | \n", "0.888889 | \n", "1.0 | \n", "0.941176 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "58 | \n", "0 | \n", "789 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... | \n", "83 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "49 | \n", "0 | \n", "20 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "88 | \n", "26 | \n", "39 | \n", "0 | \n", "0.830065 | \n", "0.771930 | \n", "1.0 | \n", "0.871287 | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "101 | \n", "7 | \n", "36 | \n", "0 | \n", "0.951389 | \n", "0.935185 | \n", "1.0 | \n", "0.966507 | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "102 | \n", "29 | \n", "431 | \n", "0 | \n", "0.948399 | \n", "0.778626 | \n", "1.0 | \n", "0.875536 | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ... | \n", "0 | \n", "68 | \n", "140 | \n", "0 | \n", "0.673077 | \n", "0.000000 | \n", "0.0 | \n", "0.000000 | \n", "
49963 rows × 27 columns
\n", "| \n", " | ISO | \n", "LLM used | \n", "Type | \n", "Data Split | \n", "Original text | \n", "Original Word Count | \n", "Original Char Count | \n", "Split Location | \n", "Modified text | \n", "New Word Count | \n", "... | \n", "ROW_TP | \n", "ROW_FP | \n", "ROW_TN | \n", "ROW_FN | \n", "ROW_ACC | \n", "ROW_PREC | \n", "ROW_REC | \n", "ROW_F1 | \n", "Label : 1 | \n", "Label : 0 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "VIE | \n", "GPT-4o | \n", "Rewritten | \n", "Test | \n", "Theo nội dung cáo trạng công bố tại phiên tòa,... | \n", "93 | \n", "411 | \n", "0 | \n", "Theo thông tin cập nhật hôm sau, bị cáo L.T đã... | \n", "68 | \n", "... | \n", "68 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "1.000000 | \n", "0.000000 | \n", "
| 1 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Rewritten | \n", "Test | \n", "Tại Trường tiểu học Lê Đình Chinh (Q.11), bên ... | \n", "87 | \n", "393 | \n", "0 | \n", "Ngày hôm sau tại Trường tiểu học Lê Đình Chinh... | \n", "90 | \n", "... | \n", "90 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "1.000000 | \n", "0.000000 | \n", "
| 2 | \n", "VIE | \n", "GPT-4o | \n", "Partial | \n", "Test | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "400 | \n", "1742 | \n", "210 | \n", "Đây là vụ tấn công thứ hai trong vòng hai tuần... | \n", "282 | \n", "... | \n", "72 | \n", "9 | \n", "201 | \n", "0 | \n", "0.968085 | \n", "0.888889 | \n", "1.0 | \n", "0.941176 | \n", "0.287234 | \n", "0.712766 | \n", "
| 3 | \n", "VIE | \n", "Claude-Sonnet-3.5 | \n", "Partial | \n", "Test | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "1544 | \n", "7097 | \n", "789 | \n", "Croatia bỏ lỡ cơ hội viết nên trang sử mới cho... | \n", "847 | \n", "... | \n", "58 | \n", "0 | \n", "789 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "0.068477 | \n", "0.931523 | \n", "
| 4 | \n", "VIE | \n", "Claude-Haiku-3.5 | \n", "Rewritten | \n", "Test | \n", "- Tôi năm nay 41 tuổi, vừa mới cưới vợ được 4 ... | \n", "106 | \n", "491 | \n", "0 | \n", "Cập nhật ngày hôm sau:\\n\\nSau khi áp dụng lời ... | \n", "83 | \n", "... | \n", "83 | \n", "0 | \n", "0 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "1.000000 | \n", "0.000000 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49958 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Partial | \n", "Test | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "67 | \n", "286 | \n", "20 | \n", "đối đãi rất tốt và không hề có mâu thuẫn trước... | \n", "69 | \n", "... | \n", "49 | \n", "0 | \n", "20 | \n", "0 | \n", "1.000000 | \n", "1.000000 | \n", "1.0 | \n", "1.000000 | \n", "0.710145 | \n", "0.289855 | \n", "
| 49959 | \n", "VIE | \n", "Amazon-Nova-Pro-1.0 | \n", "Partial | \n", "Test | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "148 | \n", "677 | \n", "65 | \n", "Từ biên giới Trung Quốc, mất chừng ba giờ lái ... | \n", "153 | \n", "... | \n", "88 | \n", "26 | \n", "39 | \n", "0 | \n", "0.830065 | \n", "0.771930 | \n", "1.0 | \n", "0.871287 | \n", "0.745098 | \n", "0.254902 | \n", "
| 49960 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "86 | \n", "384 | \n", "43 | \n", "Được biết, hiện nay dòng sản phẩm váy cưới dàn... | \n", "144 | \n", "... | \n", "101 | \n", "7 | \n", "36 | \n", "0 | \n", "0.951389 | \n", "0.935185 | \n", "1.0 | \n", "0.966507 | \n", "0.750000 | \n", "0.250000 | \n", "
| 49961 | \n", "VIE | \n", "Amazon-Nova-Lite-1.0 | \n", "Partial | \n", "Test | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "827 | \n", "3774 | \n", "460 | \n", "Bà Haley: Hội đồng bảo vệ những nước vi phạm n... | \n", "562 | \n", "... | \n", "102 | \n", "29 | \n", "431 | \n", "0 | \n", "0.948399 | \n", "0.778626 | \n", "1.0 | \n", "0.875536 | \n", "0.233096 | \n", "0.766904 | \n", "
| 49962 | \n", "VIE | \n", "Gemini-Flash-1.5 | \n", "Unchanged | \n", "Test | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "1116 | \n", "208 | \n", "Lời cáo buộc được đưa ra giữa lúc quan h... | \n", "208 | \n", "... | \n", "0 | \n", "68 | \n", "140 | \n", "0 | \n", "0.673077 | \n", "0.000000 | \n", "0.0 | \n", "0.000000 | \n", "0.326923 | \n", "0.673077 | \n", "
49963 rows × 29 columns
\n", "