MuSpike: Neues Benchmark für Musikgenerierung mit Spiking Neural Networks
Die Generierung von Symbolmusik hat mit künstlichen neuronalen Netzwerken enorme Fortschritte gemacht, doch im biologisch plausiblen Bereich der Spiking Neural Networks (SNNs) fehlt bislang ein einheitliches Benchmarking und eine umfassende Evaluationsmethodik. Mit MuSpike wird dieses Defizit endlich geschlossen.
MuSpike ist ein einheitliches Benchmark- und Evaluationsframework, das fünf repräsentative SNN-Architekturen – SNN‑CNN, SNN‑RNN, SNN‑LSTM, SNN‑GAN und SNN‑Transformer – systematisch über fünf unterschiedliche Datensätze hinweg testet. Die Datensätze decken tonale, strukturelle, emotionale und stilistische Variationen ab, sodass die Modelle unter realitätsnahen Bedingungen bewertet werden.
Ein besonderes Merkmal von MuSpike ist die Kombination aus etablierten objektiven Metriken und einer groß angelegten Hörstudie. Zusätzlich wurden neue subjektive Messgrößen entwickelt, die musikalische Eindrucksbildung, autobiografische Assoziationen und persönliche Präferenzen erfassen – Aspekte, die in früheren Arbeiten oft vernachlässigt wurden.
Die Ergebnisse zeigen, dass die verschiedenen SNN-Modelle je nach Bewertungsdimension unterschiedliche Stärken aufweisen. Teilnehmer mit unterschiedlichem musikalischem Hintergrund – von Laien bis zu Experten – zeigen vielfältige Wahrnehmungsmuster; Experten akzeptieren KI-generierte Musik tendenziell eher. Ein deutlicher Unterschied zwischen den objektiven und subjektiven Bewertungen verdeutlicht die Grenzen rein statistischer Messungen und unterstreicht die Bedeutung menschlicher Einschätzungen bei der Qualitätsbewertung von Musik.
MuSpike liefert damit das erste systematische Benchmark- und Evaluationsframework für SNN‑Modelle in der symbolischen Musikgenerierung. Es legt eine solide Basis für zukünftige Forschungsarbeiten und fördert die Entwicklung von SNN‑basierten Musiksystemen, die sowohl technisch als auch ästhetisch überzeugen.