BEE-spoke-data
/

claude-tokenizer-forT5

Model card Files Files and versions

pszemraj commited on Jul 28, 2024

Commit

69715fe

·

verified ·

1 Parent(s): 9e434fb

Update README.md

Files changed (1) hide show

README.md +9 -0

README.md CHANGED Viewed

@@ -14,6 +14,15 @@ Vocabulary size: 65103
 - relevant special tokens for T5 training added
 - post processor updated following t5's tokenizer
 ## post processor

 - relevant special tokens for T5 training added
 - post processor updated following t5's tokenizer
+usage:
+```py
+from transformers import AutoTokenizer
+tk = AutoTokenizer.from_pretrained('BEE-spoke-data/claude-tokenizer-forT5')
+inputs = tk("here are some words", return_tensors="pt")
+```
 ## post processor