Upload model Qwen2.5-7B-Instruct-v8-k65536-256-woft

Files changed (6) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,9 +1,9 @@
 ---
 license: other
 license_name: qwen
-license_link: https://huggingface.co/Qwen/Qwen2.5-7B/blob/main/LICENSE
 ---
 **Disclaimer**:
 The model is reproduced based on the paper *VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models* [github](https://github.com/microsoft/vptq) and [arXiv](https://arxiv.org/abs/2409.17066)
@@ -20,14 +20,14 @@ The PPL test results are for reference only and were collected using GPTQ testin
 ```json
 {
-  "ctx_2048": {
-    "wikitext2": 7.928572177886963
-  },
-  "ctx_4096": {
-    "wikitext2": 7.3025803565979
-  },
-  "ctx_8192": {
-    "wikitext2": 6.927831649780273
-  }
 }
-```

 ---
 license: other
 license_name: qwen
+license_link: https://huggingface.co/Qwen/Qwen2.5-7B-Instruct/blob/main/LICENSE
 ---
 **Disclaimer**:
 The model is reproduced based on the paper *VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models* [github](https://github.com/microsoft/vptq) and [arXiv](https://arxiv.org/abs/2409.17066)
 ```json
 {
+    "ctx_2048": {
+        "wikitext2": 7.946412086486816
+    },
+    "ctx_4096": {
+        "wikitext2": 7.310400009155273
+    },
+    "ctx_8192": {
+        "wikitext2": 6.938364028930664
+    }
 }
+```

config.json CHANGED Viewed

@@ -4723,11 +4723,12 @@
     }
   },
   "rms_norm_eps": 1e-06,
   "rope_theta": 1000000.0,
   "sliding_window": null,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.44.2",
   "use_cache": true,
   "use_sliding_window": false,
   "vocab_size": 152064

     }
   },
   "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
   "rope_theta": 1000000.0,
   "sliding_window": null,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.45.1",
   "use_cache": true,
   "use_sliding_window": false,
   "vocab_size": 152064

generation_config.json CHANGED Viewed

@@ -11,5 +11,5 @@
   "temperature": 0.7,
   "top_k": 20,
   "top_p": 0.8,
-  "transformers_version": "4.44.2"
 }

   "temperature": 0.7,
   "top_k": 20,
   "top_p": 0.8,
+  "transformers_version": "4.45.1"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:73041c3b3aaac8227d0e1915abee332170a60455c8d27224991b7e33caf857dc
 size 4840913528

 version https://git-lfs.github.com/spec/v1
+oid sha256:917247bc869864084d6eb0af3b8d5d8e9b3596367eed405bc7cbbce8971ea1f1
 size 4840913528

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff