Deep Reinforcement Learning optimiert Ressourcen in heterogenen Funknetzen
In heterogenen Funknetzen (HetNets) gestaltet sich die dynamische Zuteilung von Ressourcen wie Strom, Bandbreite und Zeitplänen unter wechselnden Nutzerlasten und Kanalbedingungen als besonders schwierig. Ein neues Deep‑Reinforcement‑Learning‑Framework (DRL) adressiert dieses Problem, indem es gleichzeitig die Sendeleistung, die Bandbreite und die Terminierung optimiert. Dabei wird ein mehrzieliger Belohnungsmechanismus eingesetzt, der Durchsatz, Energieeffizienz und Fairness balanciert.
Die Autoren haben reale Basisstationskoordinaten verwendet und die Leistung von Proximal Policy Optimisation (PPO) sowie Twin Delayed Deep Deterministic Policy Gradient (TD3) mit drei heuristischen Algorithmen in verschiedenen Netzwerkszenarien verglichen. Die Ergebnisse zeigen, dass die DRL‑Ansätze die heuristischen Methoden deutlich übertreffen, wenn es um die optimale Ressourcenzuteilung in dynamischen Netzwerken geht.
Diese Erkenntnisse verdeutlichen die wesentlichen Kompromisse bei der Gestaltung von DRL‑Systemen für zukünftige HetNets und unterstreichen das Potenzial von KI‑gestützten Lösungen für die effiziente Nutzung von Funkressourcen.