Forschung
LH-Bench: Neue Benchmark für subjektive Unternehmensaufgaben
Während große Sprachmodelle bei klar definierten Aufgaben wie Mathematik oder Programmieren glänzen, sind echte Unternehmensaufgaben oft su…
arXiv – cs.AI