NVIDIA stellt Open Dataset für 25 europäische Sprachen vor
In einer Welt, in der etwa 7.000 Sprachen gesprochen werden, unterstützen bislang nur wenige Sprachmodelle die Vielfalt der menschlichen Kommunikation. NVIDIA reagiert mit einem neuen, offenen Datensatz und dazugehörigen Modellen, die die Entwicklung von hochqualitativen Spracherkennungs- und Übersetzungs‑KI für 25 europäische Sprachen ermöglichen.
Der Fokus liegt besonders auf Sprachen mit begrenzten Datenressourcen – darunter Kroatisch, Estnisch und Maltisch. Durch die Bereitstellung umfangreicher, annotierter Sprachdaten und optimierter Modelle schafft NVIDIA eine solide Basis, um die Leistung von Sprach‑AI in diesen Regionen deutlich zu steigern.
Die Initiative unterstreicht NVIDIA’s Engagement, die Kluft zwischen den wenigen gut unterstützten Sprachen und den vielen, die bislang kaum in KI‑Anwendungen vertreten sind, zu überbrücken. Mit dem offenen Datensatz und den neuen Modellen wird die Entwicklung von Sprachtechnologien für europäische Sprachen demokratisiert und beschleunigt.