Taguchi-Optimierung steigert CNN-Leistung bei Box-Action-Erkennung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Studie wird die Taguchi-Design-of-Experiments-Methode auf Convolutional Neural Networks (CNNs) angewandt, um die Hyperparameter für die Erkennung von Box-Action-Videoaufnahmen systematisch zu optimieren. Durch den Einsatz eines L12(2^11)-orthogonalen Arrays wurden acht wichtige Hyperparameter – Bildgröße, Farbmodus, Aktivierungsfunktion, Lernrate, Reskalierung, Shuffling, vertikales und horizontales Flip – in zwölf experimentellen Konfigurationen getestet.

Um die Mehrzieloptimierung von Trainings- und Validierungsgenauigkeit sowie Verlustwerten zu adressieren, wurden fünf unterschiedliche Ansätze entwickelt. Dabei kam eine logarithmische Skalierung zum Einsatz, die widersprüchliche Metriken vereint und eine ganzheitliche Qualitätsbewertung innerhalb des Taguchi-Frameworks ermöglicht. Der dritte Ansatz, der gewichtete Genauigkeitsmetriken mit logarithmisch transformierten Verlustfunktionen kombiniert, erzielte die besten Ergebnisse: 98,84 % Trainingsgenauigkeit und 86,25 % Validierungsgenauigkeit bei minimalen Verlustwerten.

Die Analyse zeigte, dass die Lernrate der einflussreichste Parameter ist, gefolgt von der Bildgröße und der Aktivierungsfunktion. Diese Erkenntnisse bieten einen klaren Leitfaden für die effiziente Hyperparameteroptimierung von CNNs in der Sportvideobewertung und demonstrieren, wie statistische Optimierungsmethoden die Entwicklung leistungsfähiger Modelle beschleunigen können.

Ähnliche Artikel