Forschung
LLMs im realen Verhaltenstest: Benchmark für lange Zeiträume und Szenarien
Die rasante Entwicklung großer Sprachmodelle (LLMs) hat das Potenzial eröffnet, einen universellen Benutzersimulator zu schaffen. Trotz die…
arXiv – cs.AI