onekq-ai
/

starcoder2-3b-bnb-4bit

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

onekq commited on Oct 18, 2024

Commit

7a72b0a

·

verified ·

1 Parent(s): 04a8e39

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ Bitsandbytes quantization of https://huggingface.co/bigcode/starcoder2-3b.
 See https://huggingface.co/blog/4bit-transformers-bitsandbytes for instructions.
 ```python
-from transformers import AutoModelForCausalLM
 from transformers import BitsAndBytesConfig
 import torch
@@ -21,5 +21,8 @@ nf4_config = BitsAndBytesConfig(
    bnb_4bit_compute_dtype=torch.bfloat16
 )
 model = AutoModelForCausalLM.from_pretrained("bigcode/starcoder2-3b", quantization_config=nf4_config)
 model.push_to_hub("onekq-ai/starcoder2-3b-bnb-4bit")
 ```

 See https://huggingface.co/blog/4bit-transformers-bitsandbytes for instructions.
 ```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from transformers import BitsAndBytesConfig
 import torch
    bnb_4bit_compute_dtype=torch.bfloat16
 )
 model = AutoModelForCausalLM.from_pretrained("bigcode/starcoder2-3b", quantization_config=nf4_config)
+tokenizer = AutoTokenizer.from_pretrained("bigcode/starcoder2-3b")
 model.push_to_hub("onekq-ai/starcoder2-3b-bnb-4bit")
+tokenizer.push_to_hub("onekq-ai/starcoder2-3b-bnb-4bit")
 ```