6G-Netzwerke: KI-Modell-Caching mit CoMP-Broadcasting für schnelle Downloads

arXiv – cs.AI Original ≈2 Min. Lesezeit
Anzeige

In den kommenden 6G-Netzwerken soll das Herunterladen von KI-Modellen auf Abruf möglich sein, um die unterschiedlichen Anforderungen der Endnutzer an die Inferenzleistung zu erfüllen. Durch das proaktive Zwischenspeichern von Modellen an Edge-Knoten können die Modelle mit geringer Latenz abgerufen werden, was die On-Device-Inferenz beschleunigt.

Die enorme Größe moderner KI-Modelle stellt jedoch ein großes Problem dar: Edge-Speicher sind begrenzt und die gleichzeitige Auslieferung heterogener Modelle über drahtlose Kanäle ist schwierig. Die vorgestellte Lösung nutzt die Tatsache, dass viele Modelle aus einem gemeinsamen vortrainierten Grundmodell feinabgestimmt werden und dabei viele Parameter unverändert bleiben. Statt komplette Modelle zu speichern, werden nur die Parameterblöcke (PBs) zwischengespeichert, die in verschiedenen Modellen wiederverwendet werden können.

Zusätzlich wird koordinierte Mehrpunktübertragung (CoMP) eingesetzt, um diese wiederverwendbaren Parameterblöcke gleichzeitig an mehrere Nutzer zu senden. Dadurch wird die Downlink-Spektraleffizienz deutlich erhöht. Das System formuliert ein Optimierungsproblem, das die Verzögerung beim Modell-Download minimiert, indem es die Auswahl der zu speichernden PBs, deren Migration zwischen Edge-Knoten und die Beamforming-Strategien für das CoMP-Broadcasting gleichzeitig optimiert.

Um die damit verbundene Komplexität zu bewältigen, wurde ein verteiltes Multi-Agenten-Lernframework entwickelt. Edge-Knoten lernen dabei explizit die gegenseitigen Einflüsse ihrer Aktionen, was eine effektive Kooperation ermöglicht. Ergänzend wird ein Ansatz zur Datenaugmentation vorgestellt, der synthetische Parameterblöcke erzeugt, um die Lernumgebung dynamisch anzupassen.

Diese Kombination aus feingranuliertem Caching, CoMP-Broadcasting und lernbasierten Optimierungen eröffnet einen vielversprechenden Weg, um die wachsenden Anforderungen an KI-Modelle in 6G-Netzwerken effizient zu erfüllen.

Ähnliche Artikel