KidsArtBench: Mehrdimensionale Bewertung von Kinderkunst mit MLLMs
Ein neues Benchmark‑Set namens KidsArtBench eröffnet die Möglichkeit, Kinderkunst systematisch zu bewerten. Das Datenset umfasst über 1.000 Bilder von Kindern im Alter von fünf bis fünfzehn Jahren, die von zwölf erfahrenen Lehrkräften anhand von neun rubrikbasierten Dimensionen bewertet wurden. Zusätzlich wurden zu jeder Bewertung ausführliche Kommentare abgegeben, die als Feedback dienen.
Im Gegensatz zu bisherigen ästhetischen Datensätzen, die meist nur einen einheitlichen Punktwert für erwachsene Kunstwerke liefern, bietet KidsArtBench eine mehrdimensionale Analyse. Die Bewertungskriterien reichen von Realismus über Fantasie bis hin zu höheren kognitiven Aspekten. Diese Vielfalt ermöglicht sowohl eine ordinale Bewertung als auch formative Rückmeldungen, die für den pädagogischen Einsatz besonders wertvoll sind.
Auf Basis dieses Datensatzes wurde ein neuer Trainingsansatz entwickelt, der für jede Bewertungsebene eine eigene LoRA‑Komponente nutzt. Durch die Kombination von Attribut‑spezifischem Training und Regression‑Aware Fine‑Tuning (RAFT) konnten die Modelle die Korrelation zwischen Vorhersagen und menschlichen Bewertungen deutlich steigern – von 0,468 auf 0,653 bei Qwen2.5‑VL‑7B. Die größten Verbesserungen wurden bei perceptualen Dimensionen erzielt, während die Lücke zu höherwertigen Attributen ebenfalls reduziert wurde.
Die Veröffentlichung von Daten, Code und einer Ethik‑Dokumentation schafft ein robustes Testfeld für zukünftige Fortschritte im Bereich der bildungsorientierten KI. KidsArtBench bietet damit Lehrkräften und Forschern ein praxisnahes Werkzeug, um die künstlerische Entwicklung von Kindern objektiv zu messen und gezielt zu fördern.