Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Große Sprachmodelle”
Forschung

<h1>LLM-Agenten liefern kaum echte Evidenz: RWE-Bench zeigt große Lücken</h1> <p>Neues Benchmark‑Projekt RWE‑Bench untersucht, ob große Sprachmodelle (LLMs) in der Lage sind, komplette Beobachtungsstudien aus realen medizinischen Datenbanken zu erstellen. Dabei wird nicht nur einzelne Antworten geprüft, sondern die gesamte Kette von Kohortenbildung, Analyse und Berichtswesen.</p> <p>Der Test basiert auf der umfangreichen MIMIC‑IV‑Datenbank und nutzt Protokolle aus peer‑reviewten Studien. Für jede Aufgabe mu

arXiv – cs.AI
Forschung

<p>Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) ihre moralischen Entscheidungen stark vom Kontext beeinflussen lassen. Im Gegensatz zu bisherigen Untersuchungen, die meist feste Szenarien nutzten, analysiert die Arbeit die Wirkung von drei bekannten Kontextvariationen aus der Moralpsychologie – Konsequenzialismus, Emotionen und Beziehungsaspekte – auf die Urteilsbildung von LLMs.</p>

Zur Untersuchung wurde das Dataset Contextual MoralChoice entwickelt, das moralische Dilemmata mit systematisch veränderten Kontexten enthä…
arXiv – cs.AI
Forschung

<p>LLM-gesteuerte Agenten zeigen echte Engagement‑Mechanismen – kontrollierte Tests enthüllen</p> <p>Neues Forschungsergebnis aus dem Bereich der agentenbasierten Simulationen zeigt, dass große Sprachmodelle (LLMs) nicht nur flüssige, menschenähnliche Texte erzeugen, sondern auch echte, theorieorientierte Verhaltensmuster reproduzieren können. In einer Weibo‑ähnlichen Testumgebung wurden die Agenten gezielt mit unterschiedlichen Informationsmengen und sozialen Normen konfrontiert, während Likes und Reshares

arXiv – cs.AI
Forschung

<p>LLMs lernen dynamische Glaubensgraphen für Theory-of-Mind-Logik</p> <p>Neues Modell für große Sprachmodelle (LLMs) ermöglicht es, die sich ständig verändernden inneren Überzeugungen von Menschen zu erfassen und daraus ihre Entscheidungen abzuleiten. Während frühere Ansätze die Glaubenszustände als statisch und unabhängig betrachteten, nutzt das neue Verfahren einen strukturierten kognitiven Trajektorienmodell, das die mentale Zustandsentwicklung als dynamischen Glaubensgraphen darstellt. Dabei werden gle

arXiv – cs.AI
Forschung

<p>GenAI erweitert PRISMA: Automatisierte Systematik für Reviews</p> <p>Das PRISMA‑Framework bildet die Grundlage für systematische Übersichtsarbeiten, doch die manuellen Schritte der Datenerfassung und Literatursuche bleiben zeitintensiv und begrenzt. In einer Zeit, in der generative KI‑Modelle – insbesondere große Sprachmodelle – immer leistungsfähiger werden, eröffnet sich die Chance, diese Prozesse zu automatisieren und dadurch die Effizienz deutlich zu steigern.</p> <p>Die Autoren des Preprints arXiv:2

arXiv – cs.AI