F5-TTS-ไทย-V2

โมเดล Text To Speech ภาษาไทย V2 โดยใช้ phoneme เป็นข้อความอินพุต เพื่อลดความพิดพลาดในการอ่าน แต่อาาจะลดความเป็นธรรมชาติลง

การใช้งาน

Github

ติดตั้ง

pip install f5-tts-th

#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124

ใช้งาน

from f5_tts_th.tts import TTS
import soundfile as sf

tts = TTS(model="v2") 

wav = tts.infer(
    ref_audio="YOUR_AUDIO_PATH",
    ref_text="ได้รับข่าวคราวของเราที่จะหาที่มันเป็นไปที่จะจัดขึ้น.", 
    gen_text="สวัสดีครับ นี่คือเสียงพูดภาษาไทย.", 
    step=32, 
    cfg=2.0, 
    speed=1.0
)

sf.write("test.wav", wav, 24000)
Downloads last month
35
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VIZINTZOR/F5-TTS-TH-V2

Base model

SWivid/F5-TTS
Finetuned
(69)
this model

Collection including VIZINTZOR/F5-TTS-TH-V2