ModelCloud/Meta-Llama-3.1-8B-Instruct-gptq-4bit · Upload folder using huggingface

Upload folder using huggingface_hub

by lrl-modelcloud - opened Jul 29, 2024

←

Files changed (3) hide show

config.json CHANGED Viewed

@@ -21,16 +21,17 @@
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "quantization_config": {
     "bits": 4,
     "checkpoint_format": "gptq",
     "damp_percent": 0.005,
-    "desc_act": true,
     "group_size": 128,
     "lm_head": false,
     "meta": {
-      "quantizer": "gptqmodel:0.9.9-dev0"
     },
     "model_file_base_name": null,
     "model_name_or_path": null,
@@ -53,4 +54,4 @@
   "transformers_version": "4.44.0.dev0",
   "use_cache": true,
   "vocab_size": 128256
-}

   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
+  "pad_token_id": 128004,
   "pretraining_tp": 1,
   "quantization_config": {
     "bits": 4,
     "checkpoint_format": "gptq",
     "damp_percent": 0.005,
+    "desc_act": false,
     "group_size": 128,
     "lm_head": false,
     "meta": {
+      "quantizer": "gptqmodel:0.9.10-dev0"
     },
     "model_file_base_name": null,
     "model_name_or_path": null,
   "transformers_version": "4.44.0.dev0",
   "use_cache": true,
   "vocab_size": 128256
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43f382a2071ccb88ad4f920cf2924e531909c35071dd5ee9c459ae0a5ed3761a
 size 5732943672

 version https://git-lfs.github.com/spec/v1
+oid sha256:22ead7ca212f7be98881c8842ae9146e7362ecbbcc2ae69ff1f6a19a802972de
 size 5732943672

quantize_config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "bits": 4,
   "group_size": 128,
-  "desc_act": true,
   "static_groups": false,
   "sym": true,
   "lm_head": false,
@@ -12,6 +12,6 @@
   "quant_method": "gptq",
   "checkpoint_format": "gptq",
   "meta": {
-    "quantizer": "gptqmodel:0.9.9-dev0"
   }
 }

 {
   "bits": 4,
   "group_size": 128,
+  "desc_act": false,
   "static_groups": false,
   "sym": true,
   "lm_head": false,
   "quant_method": "gptq",
   "checkpoint_format": "gptq",
   "meta": {
+    "quantizer": "gptqmodel:0.9.10-dev0"
   }
 }