Neues Framework erklärt Proxy-Diskriminierung in KI-Entscheidungen
In hochriskanten Bereichen wie Kreditvergabe, Personalwahl oder Strafjustiz sorgen KI-Systeme zunehmend für Bedenken hinsichtlich Diskriminierung, Unfairness und Erklärbarkeit. Traditionelle Audits zeigen oft nicht, warum Ungerechtigkeiten entstehen, besonders wenn sie auf strukturellen Vorurteilen beruhen.
Die neue Methode nutzt formale abduktive Erklärungen, um Proxy-Diskriminierung auf individueller Ebene zu identifizieren. Durch Einbeziehung von Hintergrundwissen wird ermittelt, welche Merkmale als ungerechtfertigte Stellvertreter für geschützte Attribute fungieren und damit verborgene strukturelle Verzerrungen aufdecken.
Zentral ist das Konzept der „Aptitude“ – eine aufgabenrelevante Eigenschaft, die unabhängig von Gruppenzugehörigkeit ist. Eine Zuordnungsfunktion vergleicht Personen mit gleicher Aptitude aus verschiedenen Gruppen, um Fairness auf substantieller Ebene zu bewerten.
Als Demonstration wurde das Framework anhand von Beispielen aus dem deutschen Kreditdatensatz angewendet. Die Ergebnisse zeigen, dass die Technik in realen Szenarien praktikabel ist und konkrete Einblicke in die Ursachen von Diskriminierung liefert.