MOBIMEM: Agenten können sich selbst weiterentwickeln – ohne Modell-Neutraining
In der heutigen Welt werden Sprachmodelle zunehmend als Agenten eingesetzt, um komplexe Arbeitsabläufe auf mobilen und Desktop‑Plattformen zu automatisieren. Trotz ihrer Leistungsfähigkeit stoßen diese Agenten jedoch an Grenzen, wenn es darum geht, sich nach dem Deployment selbst zu verbessern. Traditionell erfordert jede Optimierung ein erneutes Training oder Feintuning des Modells – ein Prozess, der enorme Rechenressourcen beansprucht und ein Spannungsfeld zwischen Genauigkeit und Ausführungsgeschwindigkeit schafft.
Die neue Architektur MOBIMEM löst dieses Problem, indem sie die Weiterentwicklung von Agenten von den Modellgewichten trennt und stattdessen auf ein speicherzentriertes System setzt. Dabei werden drei spezialisierte Speicherprimitive eingeführt: Profile Memory, Experience Memory und Action Memory.
Profile Memory nutzt eine leichte Distanz‑Graph‑Struktur (DisGraph), um Benutzervorlieben präzise abzubilden. Dadurch kann der Agent schnell auf individuelle Präferenzen reagieren, ohne die Genauigkeit zu opfern, und die Latenz bei der Profilabfrage wird signifikant reduziert.
Experience Memory setzt auf mehrstufige Vorlagen, die es dem Agenten ermöglichen, neue Aufgaben zu erkennen und die passende Ausführungslogik zu generieren. Diese Technik sorgt dafür, dass die Fähigkeiten des Agenten ohne erneutes Training generalisiert werden können.
Action Memory speichert detaillierte Interaktionssequenzen, sodass der Agent häufige Aktionen wiederverwenden kann, ohne jedes Mal das Modell auszuführen. Das Ergebnis ist eine geringere Abhängigkeit von teurer Inferenz und eine höhere Effizienz.
Zusätzlich integriert MOBIMEM eine Reihe von Betriebssystem‑inspirierten Diensten: einen Scheduler, der parallele Teilaufgaben und Speicheroperationen koordiniert; ein Agent Record‑and‑Replay (AgentRR) System, das sichere und effiziente Wiederverwendung von Aktionen ermöglicht; sowie einen kontextsensitiven Ausnahmebehandlungsmechanismus, der Unterbrechungen und Laufzeitfehler sanft abfängt.
Tests auf der Android‑Plattform zeigen, dass MOBIMEM Agenten in der Lage ist, sich kontinuierlich zu verbessern, ohne dass ein erneutes Training erforderlich ist. Die Kombination aus Speicherprimitive und OS‑ähnlichen Services führt zu einer deutlichen Steigerung der Leistung und einer besseren Anpassungsfähigkeit an individuelle Nutzerbedürfnisse.