Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -37,16 +37,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 3
-- mixed_precision_training: Native AMP
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 32
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 3
 ### Training results

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6d3a82554b72a50229ae009d8e5bc6208b66edb67d72d56ad8dbe4a39c1ac
 size 67126232

 version https://git-lfs.github.com/spec/v1
+oid sha256:80d3996d2ebce09845819d3d189577571266062adcf5ae8d715a1aa611dfcef2
 size 67126232

runs/Feb23_22-33-37_84ac7c29600b/events.out.tfevents.1708727682.84ac7c29600b.368.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ba02779ca8a5d03e0c23a663b717d6ce0f0890a478a76afa15d9d415e7affbe
-size 4184

 version https://git-lfs.github.com/spec/v1
+oid sha256:cfa7923feeae6e0ec5923af6a027d0c183ad7e39948a014c4094794e3903faea
+size 5195