Neues ASR-Modell nutzt Artikulationsdaten für bessere Erkennung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer aktuellen Studie wird die Rolle von Artikulationsmerkmalen in der automatischen Spracherkennung neu beleuchtet. Durch die Kombination von Sprachumkehrung als Hilfsaufgabe und die Einbindung der vorhergesagten Artikulationsdaten in ein Cross‑Attention‑Modul erzielt das Modell signifikante Verbesserungen gegenüber etablierten Transformer‑Baselines. Besonders bei begrenzten Datenmengen zeigen sich deutliche Fortschritte, was die Bedeutung moderner Architekturen für die Nutzung von Artikulationsinformationen unterstreicht.

Ähnliche Artikel