TinyLlama
/

TinyLlama-1.1B-Chat-v1.0

Text Generation

text-generation-inference

Model card Files Files and versions

Add link to Neuron-optimized version

#59

by badaoui HF Staff - opened Sep 16

base: refs/heads/main

←

from: refs/pr/59

Discussion Files changed

Files changed (1) hide show

README.md +13 -1

README.md CHANGED Viewed

@@ -63,4 +63,16 @@ print(outputs[0]["generated_text"])
 # How many helicopters can a human eat in one sitting?</s>
 # <|assistant|>
 # ...
-```

 # How many helicopters can a human eat in one sitting?</s>
 # <|assistant|>
 # ...
+```
+---
+## 🚀 AWS Neuron Optimized Version Available
+A Neuron-optimized version of this model is available for improved performance on AWS Inferentia/Trainium instances:
+**[badaoui/TinyLlama-TinyLlama-1.1B-Chat-v1.0-neuron](https://huggingface.co/badaoui/TinyLlama-TinyLlama-1.1B-Chat-v1.0-neuron)**
+The Neuron-optimized version provides:
+- Pre-compiled artifacts for faster loading
+- Optimized performance on AWS Neuron devices
+- Same model capabilities with improved inference speed