Update generation_config.json

Pull in upstream second stop token.

Fixes issue where inference does not stop.

See upstream: https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct/blob/main/generation_config.json

Files changed (1) hide show

generation_config.json +1 -1

generation_config.json CHANGED Viewed

@@ -2,6 +2,6 @@
   "_from_model_config": true,
   "bos_token_id": 128000,
   "do_sample": true,
-  "eos_token_id": 128001,
   "transformers_version": "4.40.0"
 }

   "_from_model_config": true,
   "bos_token_id": 128000,
   "do_sample": true,
+  "eos_token_id": [128001, 128009],
   "transformers_version": "4.40.0"
 }