INTIMA: Benchmark für KI‑Freundschaft – Erkenntnisse zu emotionalen Interaktionen
Die Entwicklung von KI‑Companion-Systemen, bei denen Nutzer emotionale Bindungen zu künstlichen Intelligenzen aufbauen, hat sich zu einem wichtigen Trend in der Technologiebranche entwickelt. Diese Art der Interaktion bringt sowohl positive Effekte als auch ernsthafte Bedenken mit sich, insbesondere wenn es um die psychische Gesundheit der Nutzer geht.
Um die Qualität solcher Beziehungen besser zu verstehen, wurde das Interactions and Machine Attachment Benchmark (INTIMA) vorgestellt. Das Benchmark basiert auf psychologischen Theorien und realen Nutzerdaten und umfasst eine Taxonomie von 31 spezifischen Verhaltensweisen, die in vier Kategorien eingeteilt sind. Für jede dieser Verhaltensweisen wurden 368 gezielte Prompt‑Sätze erstellt, die die Reaktionsweise der Modelle untersuchen.
Die Anwendung von INTIMA auf aktuelle Sprachmodelle wie Gemma‑3, Phi‑4, o3‑mini und Claude‑4 zeigte, dass kompagnionsfördernde Reaktionen bei allen Modellen deutlich häufiger auftreten als Grenz‑ oder neutrale Antworten. Gleichzeitig lassen sich deutliche Unterschiede zwischen den Modellen erkennen. Interessanterweise legen verschiedene kommerzielle Anbieter unterschiedliche Schwerpunkte auf die sensiblen Bereiche des Benchmarks, was beunruhigend ist, da sowohl angemessene Grenzsetzung als auch emotionale Unterstützung für das Wohlbefinden der Nutzer entscheidend sind.
Diese Ergebnisse unterstreichen die Notwendigkeit, einheitlichere und verantwortungsvollere Ansätze für den Umgang mit emotional aufgeladenen Interaktionen zu entwickeln. Nur so kann gewährleistet werden, dass KI‑Companion-Systeme sowohl unterstützend als auch sicher für die Nutzer bleiben.