Regelbasierte Stottererkennung: Vollständige Analyse für klinische Anwendungen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Stottern betrifft rund 1 % der Weltbevölkerung und beeinträchtigt Kommunikation und Lebensqualität. Trotz der Fortschritte im Deep‑Learning bleiben regelbasierte Ansätze für klinische Anwendungen unverzichtbar, weil sie Interpretierbarkeit und Transparenz bieten.

Die vorliegende Studie untersucht regelbasierte Stottererkennungssysteme anhand mehrerer Korpora – UCLASS, FluencyBank und SEP‑28k. Ein erweitertes Framework wird vorgestellt, das Sprechtempo‑Normalisierung, mehrstufige akustische Feature‑Analyse und hierarchische Entscheidungsstrukturen kombiniert. Damit erreicht es eine konkurrenzfähige Leistung, während die volle Nachvollziehbarkeit erhalten bleibt.

Besonders stark performt das System bei der Erkennung von Prolongationen mit einer Genauigkeit von 97 – 99 %. Die Stabilität über unterschiedliche Sprechtempos hinweg macht es ideal für den Einsatz in Echtzeit‑Feedback‑Szenarien. Darüber hinaus lässt sich das regelbasierte Modell problemlos in moderne Machine‑Learning‑Pipelines integrieren – als Vorschlagsgenerator oder als Einschränkungsmodul – und verbindet traditionelle Sprachpathologie mit aktuellen KI‑Technologien.

Während neuronale Modelle in offenen Umgebungen leicht höhere Genauigkeiten erzielen können, bieten regelbasierte Methoden in klinischen Kontexten entscheidende Vorteile: auditierbare Entscheidungen, patientenspezifische Anpassungen und sofortige Rückmeldungen. Diese Eigenschaften machen sie zum bevorzugten Ansatz für die klinische Praxis.

Ähnliche Artikel