KI News: Kurz und klar.

Anmelden

Align2Speak: Improving TTS for Low Resource Languages via ASR-Guided Online Preference Optimization

arXiv – cs.AI • 29.09.2025 05:00 • Original

#Text‑zu‑Sprache #Mehrsprachiges Modell #Gruppen‑Relative‑Policy‑Optimierung #IPA‑Token #Prosodie #Unpaarer Text #Sprachverifikation

Anzeige

Ähnliche Artikel

MarkTechPost • 03.10.2025 07:22

Neuphonic Open-Sources NeuTTS Air: A 748M-Parameter On-Device Speech Language Model with Instant Voice Cloning

arXiv – cs.AI • 22.09.2025 05:00

Impact of Phonetics on Speaker Identity in Adversarial Voice Attack

MarkTechPost • 26.08.2025 00:28

Microsoft präsentiert VibeVoice-1.5B: TTS mit 90 Minuten Audio und vier Stimmen