KI-Modelle übertreffen Menschen bei Vorhersage sozialer Normen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Eine neue Studie aus dem arXiv-Repository zeigt, dass moderne Sprachmodelle die menschliche Genauigkeit bei der Einschätzung sozialer Normen übertreffen. Forscher haben die Fähigkeit mehrerer KI-Systeme getestet, anhand von 555 Alltagsszenarien die Angemessenheit menschlicher Entscheidungen vorherzusagen.

In der ersten Untersuchung erreichte GPT‑4.5 die höchste Präzision: Es konnte die durchschnittliche menschliche Beurteilung auf einer kontinuierlichen Skala besser vorhersagen als jeder einzelne Teilnehmer – ein Ergebnis im 100‑ten Perzentil. Die zweite Studie bestätigte diese Erkenntnis und zeigte, dass Gemini 2.5 Pro 98,7 % der Menschen übertraf, GPT‑5 97,8 % und Claude Sonnet 4 96,0 %.

Trotz dieser beeindruckenden Leistungen weisen alle Modelle systematische, korrelierte Fehler auf. Die Ergebnisse deuten darauf hin, dass komplexe Modelle sozialer Kognition allein aus statistischem Lernen über sprachliche Daten entstehen können. Sie stellen die Idee in Frage, dass körperliche Erfahrung die einzige Voraussetzung für kulturelle Kompetenz ist, und legen nahe, dass Sprache ein reiches Repository für die Weitergabe kultureller Normen darstellt.

Ähnliche Artikel