Forschung
EsoLang-Bench: KI testen in exotischen Programmiersprachen
Ein neues Benchmark namens EsoLang-Bench wurde entwickelt, um die echte Denkfähigkeit großer Sprachmodelle zu prüfen. Dabei werden fünf sel…
arXiv – cs.AI