Spiking Decision Transformer: Neuromorphe Effizienz für energiearme Sequenzsteuerung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neuer Ansatz im Bereich des Reinforcement Learning kombiniert die Leistungsfähigkeit von Transformer‑Architekturen mit der Energieeffizienz von Spiking Neural Networks. Der Spiking Decision Transformer (SNN‑DT) integriert Leaky‑Integrate‑and‑Fire‑Neuronen in jedes Self‑Attention‑Block, sodass die Modellierung von Entscheidungssequenzen in einem event‑getriebenen, ultra‑low‑power‑Framework möglich wird.

Durch den Einsatz von surrogate gradients wird das Netzwerk end‑to‑end trainiert, während biologisch inspiriertes Three‑Factor‑Plasticity, phasenverschobene spike‑basierte Positionskodierungen und ein leichtgewichtiges dendritisches Routing‑Modul die Lernfähigkeit und Effizienz weiter steigern. Die Kombination dieser Techniken ermöglicht es, klassische Kontrollaufgaben wie CartPole, MountainCar, Acrobot und Pendulum mit vergleichbarer oder besserer Leistung zu lösen, während pro Entscheidung weniger als zehn Spikes erzeugt werden.

Die geringe Spike‑Rate dient als Energie‑Proxy und deutet auf eine Reduktion der Inferenzenergie um mehr als vier Größenordnungen hin. Damit eröffnet der SNN‑DT einen vielversprechenden Weg für Echtzeit‑Kontrolle auf eingebetteten und tragbaren Geräten, die stark energiebeschränkt sind, ohne dabei die Leistungsfähigkeit traditioneller Transformer‑Modelle zu verlieren.

Ähnliche Artikel