LIFineTuned

Paused

alexkueck commited on Aug 13, 2023

Commit

9dff459

1 Parent(s): d60bd16

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ import gradio as gr
 import torch
 from utils import *
 from presets import *
-from transformers import Trainer, TrainingArguments, DataCollatorWithPadding
 import numpy as np
 import evaluate
 import pandas as pd
@@ -197,7 +197,8 @@ lm_datasets = tokenized_datasets.map(
 )
 # Batches von Daten zusammenfassen
-data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
 print ("###############lm datasets####################")

 import torch
 from utils import *
 from presets import *
+from transformers import Trainer, TrainingArguments, DataCollatorForLanguageModeling
 import numpy as np
 import evaluate
 import pandas as pd
 )
 # Batches von Daten zusammenfassen
+tokenizer.pad_token = tokenizer.eos_token
+data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
 print ("###############lm datasets####################")