{ "name": "hindi-tokenizer", "version": "1.0.0", "model_type": "sentencepiece", "sp_model_type": "unigram", "tokenizer_class": "SentencePieceTokenizer", "bos_token": "", "eos_token": "", "pad_token": "", "unk_token": "", "mask_token": "", "cls_token": "", "sep_token": "", "model_max_length": 512, "vocab_size": 16000, "do_lower_case": false, "special_tokens_map": { "pad_token": "", "unk_token": "", "bos_token": "", "eos_token": "", "mask_token": "", "sep_token": "", "cls_token": "" }, "tokenizer_file": "tokenizer.model", "auto_map": { "AutoTokenizer": [ "PreTrainedTokenizerFast", null ] } }