Mehr Stimmen bedeuten nicht mehr Wahrheit: Warum Konsens bei LLMs versagt
Forscher haben untersucht, ob die Erhöhung der Inferenzkosten durch das Sammeln vieler Antworten die Wahrhaftigkeit großer Sprachmodelle in Bereichen ohne einfache Verifikation verbessern kann. Dabei wurden fünf Benchma…