metadata
license: cc0-1.0
language:
- az
base_model:
- ResembleAI/chatterbox
pipeline_tag: text-to-speech
library_name: transformers
tags:
- azerbaijani
- Azerbaijan
- voice-cloning
- TTS
Chatterbox Azerbaijani
Training quality TTS with limited data.

demo audios:
"Salam, sən necəsən? Mən yaxşıyam, təşəkkür edirəm"
"Bu gün havalar çox isti və günəşlidir."
"Bakı Azərbaycanın paytaxtıdır və çox gözəldir."
"Mən azərbaycan dilini sevirəm və onu öyrənmək istəyirəm."
"Dünən dostumla birlikdə kinoya getdik və çox xoşbəxt idik."
💻 Inference Code
First, download the file from huggingface and place it in the current directory.
The pypi version is delayed, so you must use the github version.
!git clone https://github.com/resemble-ai/chatterbox.git chatterbox_git
!pip install chatterbox-tts
from chatterbox_git.src.chatterbox import mtl_tts
import torchaudio as ta
from safetensors.torch import load_file as load_safetensors
device = "cpu" # or mps or cuda
multilingual_model = mtl_tts.ChatterboxMultilingualTTS.from_pretrained(device=device)
# ----
# Then download the file from huggingface and place it in the current directory.
# ----
t3_state = load_safetensors("t3_az.safetensors", device="cpu")
multilingual_model.t3.load_state_dict(t3_state)
multilingual_model.t3.to(device).eval()
azerbaijani_text = "Dünən dostumla birlikdə kinoya getdik və çox xoşbəxt idik"
wav_azerbaijani = multilingual_model.generate(azerbaijani_text)
ta.save("test-az.wav", wav_azerbaijani, multilingual_model.sr)
contact :
e-mail : [email protected]
☕ Support
I trained this model from my own financial resources with the sole aim of offering it to the huggingface open source community.
This model has cost me a lot of money. If you find this checkpoint useful and would like to support my work, you can do it via Ko-fi: