Unüberwachtes Bewertungssystem für Folienqualität: 7 Design-Metriken + CLIP‑ViT
Eine neue, völlig unüberwachte Methode zur Bewertung der Qualität von Präsentationsfolien wurde vorgestellt. Das System kombiniert sieben visuelle Design‑Metriken, die von Experten inspiriert sind – darunter Weißraum, Farbintensität, Kantendichte, Helligkeitskontrast, Textdichte, Farbharmonie und Layout‑Balance – mit multimodalen CLIP‑ViT‑Einbettungen. Durch die Anwendung eines Isolation‑Forest‑Anomalie‑Scorings kann die Qualität jeder Folie objektiv bewertet werden.
Die Entwickler trainierten das Modell mit 12.000 professionellen Vortragsfolien und testeten es an sechs akademischen Vorträgen, die insgesamt 115 Folien umfassten. Die Ergebnisse zeigten eine Pearson‑Korrelation von bis zu 0,83 mit den von Menschen erstellten Qualitätsbewertungen – ein deutlich höherer Wert als bei führenden Vision‑Language‑Modellen wie ChatGPT o4‑mini‑high, ChatGPT o3, Claude Sonnet 4 und Gemini 2.5 Pro, die lediglich 1,79‑ bis 3,23‑mal schlechter abschnitten.
Die Studie demonstriert sowohl konvergente Gültigkeit mit visuellen Bewertungen als auch diskriminante Gültigkeit gegenüber Sprecher‑Leistungs‑Scores. Darüber hinaus lässt sich die Methode mit allgemeinen Eindrücken der Zuhörer in Einklang bringen. Diese Ergebnisse zeigen, dass die Kombination aus niedrigen Design‑Cues und multimodalen Embeddings die Wahrnehmung der Folienqualität durch das Publikum sehr genau abbildet. Das System ermöglicht damit skalierbares, objektives Feedback in Echtzeit und eröffnet neue Möglichkeiten für die automatisierte Qualitätskontrolle von Präsentationen.