ZebraArena: Neue Simulationsumgebung für Tool‑gestützte LLMs
Tool‑gestützte große Sprachmodelle (LLMs) müssen ihre mehrstufige Logik eng mit externen Aktionen verknüpfen. Bisherige Tests verwechseln dieses Zusammenspiel jedoch häufig mit komplexen Umgebungsdynamiken, auswendig ge…