Effiziente Bildklassifikation mit quasi‑zirkulären Graphen und Ising‑Modellen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Forscher haben ein neues, einheitliches Verfahren vorgestellt, das Erkenntnisse aus der statistischen Physik, der Codierungstheorie und der algebraischen Topologie kombiniert, um Bilder in mehreren Klassen sehr schnell und präzise zu klassifizieren. Dabei werden hochdimensionale Merkmalsvektoren, die aus einem eingefrorenen MobileNetV2‑Backbone stammen, als Spins auf einem sparsamen Multi‑Edge‑Type quasi‑zirkulären LDPC‑Graphen (MET‑QC‑LDPC) interpretiert und bilden ein Random‑Bond Ising Model (RBIM).

Das Modell wird bei der sogenannten Nishimori‑Temperatur betrieben, bei der die kleinste Eigenwert des Bethe‑Hessian‑Matrizen verschwindet und die Trennschärfe zwischen den Klassen maximiert wird. Die Autoren zeigen, dass lokale Fangeinheiten im Graphen mit topologischen Invarianten – Betti‑Zahlen und Bordism‑Klassen – des Merkmalsmanifolds korrespondieren. Diese theoretische Verbindung ermöglicht es, die Graphen gezielt zu gestalten, um schädliche Fangeinheiten zu unterdrücken.

Ein praktischer Algorithmus schätzt die Nishimori‑Temperatur effizient mit einer quadratischen Interpolationskurve und einer Newton‑Korrektur, was die Laufzeit im Vergleich zur herkömmlichen Bisektionsmethode um das Sechsfache reduziert. Durch die topologie‑geleitete Konstruktion von sphärischen und toroidalen MET‑QC‑LDPC‑Graphen können die 1280‑dimensionalen Features auf 32 oder 64 Dimensionen komprimiert werden. Trotz einer 40‑fachen Reduktion der Parameterzahl erreicht das System 98,7 % Genauigkeit auf dem ImageNet‑10‑Set und 82,7 % auf ImageNet‑100, was die Leistungsfähigkeit von physik‑inspirierten, topologie‑gesteuerten Embeddings unterstreicht.

Ähnliche Artikel