efederici
/

ipt-350m

Text Generation

text-generation-inference

text generation

Model card Files Files and versions

efederici commited on Sep 16, 2023

Commit

fa0590e

·

1 Parent(s): 3f94072

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ language:
 # ipt-350m
-ipt-350m is a decoder-style transformer pretrained from scratch on ~13B tokens of Italian text.
 It uses a modified transformer architecture optimized for efficient training and inference. Positional embeddings are replaced with Attention with Linear Biases ([ALiBi](https://arxiv.org/abs/2108.12409)).

 # ipt-350m
+ipt-350m is a decoder-style transformer pretrained from scratch on ~13B tokens of Italian text (wip: trained on unfiltered oscar).
 It uses a modified transformer architecture optimized for efficient training and inference. Positional embeddings are replaced with Attention with Linear Biases ([ALiBi](https://arxiv.org/abs/2108.12409)).