Inovativní model převodu textu na řeč s otevřenými váhami, který byl vyškolen na více než 200 000 hodinách dat hlasu více jazyků.
Zonos TTS je navržen tak, aby generoval velmi přirozený hlas z textových vodítek, využívaje vložení mluvčího nebo zvukové předpony. Potřebuje pouze několik sekund referenčního zvuku, aby dosáhl vynikajícího kopírování hlasu.
Tento model poskytuje přesnou kontrolu nad parametry řeči, jako je rychlost mluvení, změny výšky hlasu, kvalita zvuku a emocionální odstín jako štěstí, strach, smutek a hněv. Zonos TTS generuje nativně zvuk 44kHz, aby zajistil vrcholovou kvalitu zvuku.
Začít používat
Vygenerujte vysokokvalitní výstup TTS zadáním požadovaného textu a vzorky mluvčího trvající 10-30 sekund.
Zlepšete shodu mluvčího přidáním zvukového předpony k textovému vstupu, což umožňuje činnosti jako šeptání.
Podporuje angličtinu, japonštinu, čínštinu, francouzštinu a němčinu s přirozeným výslovností.
Přesně upravujte mluvenou rychlost, výšku tónu, kvalitu zvuku a výraz emocí.
import torch import torchaudio from zonos.model import Zonos from zonos.conditioning import make_cond_dict # Initialize model model = Zonos.from_pretrained("Zyphra/Zonos-v0.1-transformer", device="cuda") # Load audio sample wav, sampling_rate = torchaudio.load("assets/exampleaudio.mp3") speaker = model.make_speaker_embedding(wav, sampling_rate) # Generate speech cond_dict = make_cond_dict( text="Hello, world!", speaker=speaker, language="en-us" ) conditioning = model.prepare_conditioning(cond_dict) codes = model.generate(conditioning) # Save output wavs = model.autoencoder.decode(codes).cpu() torchaudio.save("sample.wav", wavs[0], model.autoencoder.sampling_rate)
uv run gradio_interface.py # python gradio_interface.py
Zonos TTS Github >>
Zonos TTS aktuálně podporuje angličtinu, japonštinu, čínštinu, francouzštinu a němčinu.
Můžete jemně upravit emoční odstín tím, že budete přizpůsobovat parametry jako štěstí, vztek, smutek a strach v nastavení.
Časový faktor Zonos TTS je přibližně 2x při běhu na RTX 4090.
Zonos TTS může být snadno nainstalován a nasazen pomocí souborů Docker poskytnutých v našem úložišti.
Pro informace o obchodním použití se podívejte na naše licenční podmínky.