Forschung
PilotBench: Benchmark für General Aviation Agenten mit Sicherheitsanforderungen
Mit dem Aufkommen von Large Language Models (LLMs) in der realen Welt stellt sich die zentrale Frage: Können Modelle, die ausschließlich au…
arXiv – cs.AI