Neues Framework enthüllt: GNNs merken sich Labels – Homophilie senkt Memorierung
Forscher haben ein neues Tool namens NCMemo entwickelt, das die Fähigkeit von Graph Neural Networks (GNNs) misst, Trainingsdaten zu memorieren. Das System bewertet, wie stark ein GNN die Labels einzelner Knoten im semi‑supervised Node‑Classification‑Setting speichert.
Die Analyse zeigt, dass ein inverses Verhältnis zwischen Memorierung und Graph‑Homophilie besteht. In Graphen, in denen benachbarte Knoten unterschiedliche Labels oder Merkmale aufweisen, steigt die Tendenz der GNNs, die Labels zu memorieren. Das liegt daran, dass die Struktur in solchen Fällen weniger informative Hinweise liefert, sodass das Modell die Labels direkt speichert, um den Trainingsverlust zu minimieren.
Besonders stark memorieren Knoten, deren Nachbarschaft im Merkmalsraum große Label‑Inkonsistenzen aufweist. Um dieses Verhalten zu reduzieren, haben die Autoren Graph‑Rewiring‑Methoden eingesetzt. Die Ergebnisse zeigen, dass Rewiring die Memorierung deutlich verringert, ohne die Modellleistung zu beeinträchtigen, und gleichzeitig das Risiko von Datenschutzverletzungen senkt.
Die Studie liefert damit wichtige Einblicke in die Lernmechanismen von GNNs und eröffnet Wege zu datenschutzfreundlicheren Graph‑Modellen.