Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “ABB”
Forschung

<h1>MC-Search: Benchmark für multimodale Agenten mit langen Beweisketten</h1> <p>Die neueste Veröffentlichung auf arXiv (2603.00873v1) stellt MC‑Search vor – ein wegweisendes Benchmark‑Set, das multimodale Agenten in ihrer Fähigkeit testet, komplexe, mehrstufige und wissensbasierte Aufgaben zu lösen. Im Gegensatz zu bisherigen Tests, die meist kurze Frage‑Antwort‑Ketten abbilden, umfasst MC‑Search 3 333 hochwertige Beispiele, die durchschnittlich 3,7 Schritte (Hops) enthalten und fünf typische Denkstrukture

arXiv – cs.AI
Forschung

KI-Agenten: Wie gut spiegeln sie die reale Arbeitswelt wider?<br/><p>In einer neuen Studie von arXiv (2603.01203v1) wird untersucht, inwieweit die Entwicklung von KI-Agenten tatsächlich die Vielfalt und den Umfang menschlicher Arbeit abbildet. Die Forscher haben 43 Benchmarks und über 72.000 Aufgaben analysiert und diese mit den 1.016 realen US-Berufen verglichen. Dabei zeigte sich ein deutlicher Mismatch: Die meisten Benchmarks konzentrieren sich stark auf Programmieraufgaben, während die meisten Arbeitspl

arXiv – cs.AI
Forschung

Full-Waveform-Inversion (FWI) ist ein hochkomplexes, nichtlineares Problem, das versucht, Untergrundgeschwindigkeitskarten aus an der Oberfläche aufgezeichneten seismischen Wellen zu rekonstruieren. Traditionell wurden datengetriebene FWI-Methoden mit kleinen Modellen trainiert, weil verfügbare Datensätze begrenzte Volumen, geologische Vielfalt und räumliche Ausdehnung aufweisen. Diese Beschränkungen führten zu erheblichen Bedenken hinsichtlich Overfitting und einer schlechten Generalisierung auf realistisc

In der vorliegenden Studie wird gezeigt, dass ein Modell, das ausschließlich auf simulierten und relativ einfachen Daten trainiert wurde, e…
arXiv – cs.LG