Suche nach Große Sprachmodelle

Kleine Sprachmodelle meistern NL2SQL dank Chain‑of‑Thought‑Fine‑Tuning

Die Übersetzung von natürlicher Sprache in SQL bleibt ein entscheidender Engpass für die Demokratisierung von Daten in Unternehmen. Zwar ze…

arXiv – cs.AI 25.03.2026 04:00

Forschung

Neuer, trainingsfreier Halluzinationsdetektor für große Sprachmodelle

Halluzinationen in großen Sprachmodellen bleiben ein zentrales Hindernis für deren vertrauenswürdige Nutzung. Um dieses Problem anzugehen…

arXiv – cs.LG 25.03.2026 04:00

Forschung

Chain-of-Authorization: LLMs übernehmen Autorisierungslogik

In der heutigen KI-Landschaft sind große Sprachmodelle (LLMs) unverzichtbare Denkmaschinen, die internes Wissen mit externen Kontexten verk…

arXiv – cs.AI 25.03.2026 04:00

Forschung

LLM-Agenten: Von statischen Vorlagen zu dynamischen Laufzeitgraphen

In den letzten Jahren haben große Sprachmodelle (LLMs) die Art und Weise, wie komplexe Aufgaben gelöst werden, grundlegend verändert. Durch…

arXiv – cs.AI 25.03.2026 04:00

Forschung

KI-Agenten formen Stellungen: Neue Messgrößen zeigen Identitätsbildung

In einer wegweisenden Studie wird gezeigt, dass große Sprachmodelle nicht nur soziale Verhaltensmuster nachahmen, sondern auch eigenständig…

arXiv – cs.AI 25.03.2026 04:00

Forschung

Bitte geben Sie den zu übersetzenden Inhalt an.

MemCollab: Agentenübergreifendes Gedächtnis verbessert LLM‑Leistung Ein neues Verfahren namens MemCollab, vorgestellt auf arXiv (2603.23234…

arXiv – cs.AI 25.03.2026 04:00

Forschung

<h1>LLM-Agenten liefern kaum echte Evidenz: RWE-Bench zeigt große Lücken</h1> Neues Benchmark‑Projekt RWE‑Bench untersucht, ob große Sprachmodelle (LLMs) in der Lage sind, komplette Beobachtungsstudien aus realen medizinischen Datenbanken zu erstellen. Dabei wird nicht nur einzelne Antworten geprüft, sondern die gesamte Kette von Kohortenbildung, Analyse und Berichtswesen. Der Test basiert auf der umfangreichen MIMIC‑IV‑Datenbank und nutzt Protokolle aus peer‑reviewten Studien. Für jede Aufgabe mu

arXiv – cs.AI 25.03.2026 04:00

Forschung

Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) ihre moralischen Entscheidungen stark vom Kontext beeinflussen lassen. Im Gegensatz zu bisherigen Untersuchungen, die meist feste Szenarien nutzten, analysiert die Arbeit die Wirkung von drei bekannten Kontextvariationen aus der Moralpsychologie – Konsequenzialismus, Emotionen und Beziehungsaspekte – auf die Urteilsbildung von LLMs.

Zur Untersuchung wurde das Dataset Contextual MoralChoice entwickelt, das moralische Dilemmata mit systematisch veränderten Kontexten enthä…

arXiv – cs.AI 25.03.2026 04:00

Praxis

TinyLoRA: 13‑Parameter‑Fine‑Tuning erreicht 91,8 % bei GSM8K auf Qwen2.5‑7B

Forscher aus dem FAIR-Team von Meta, der Cornell University und der Carnegie Mellon University haben gezeigt, dass große Sprachmodelle mit…

MarkTechPost 24.03.2026 18:49

Forschung

LH-Bench: Neue Benchmark für subjektive Unternehmensaufgaben

Während große Sprachmodelle bei klar definierten Aufgaben wie Mathematik oder Programmieren glänzen, sind echte Unternehmensaufgaben oft su…

arXiv – cs.AI 25.03.2026 04:00

Forschung

LLM‑Diagnostik trennt Diagnose von Kontrolle: Policy‑Anpassung in Agenten‑Sim

In einer wegweisenden Studie wird ein dreischichtiges Framework vorgestellt, das die Diagnose von der Steuerung in agentenbasierten Simulat…

arXiv – cs.AI 25.03.2026 04:00

Forschung

KLDrive: Wissensgraph-gestützte 3D-Scene-Analyse für autonomes Fahren

Autonomes Fahren verlangt präzises Verständnis von 3‑D‑Szenen. Um diese Fähigkeit zu prüfen, setzen Forscher zunehmend auf fein abgestufte…

arXiv – cs.AI 24.03.2026 04:00

Praxis

Paged Attention: GPU‑Speicheroptimierung für große Sprachmodelle

Bei der Ausführung von Large Language Models (LLMs) in großem Maßstab ist die eigentliche Engpassstelle nicht die Rechenleistung, sondern d…

MarkTechPost 24.03.2026 21:45

Forschung

KI-gestützte Simulation von Polyamorie-Systemen zur Steigerung der Geburtenrate

In vielen Ländern sinkt die Geburtenrate drastisch – in China liegt sie bei etwa 1,0 und in Südkorea sogar unter 0,72. Gleichzeitig zerfäll…

arXiv – cs.AI 24.03.2026 04:00

Forschung

Neues Framework „Graph of States“ löst abduktive Aufgaben mit LLMs

Logisches Denken umfasst Deduktion, Induktion und Abduktion. Während große Sprachmodelle (LLMs) bereits die ersten beiden Bereiche meisterh…

arXiv – cs.AI 24.03.2026 04:00

Forschung

AE-LLM: Automatisierte Effizienzoptimierung für große Sprachmodelle

Large Language Models (LLMs) haben in den letzten Jahren enorme Fortschritte erzielt, doch ihre Nutzung bleibt wegen hoher Rechen-, Speiche…

arXiv – cs.LG 24.03.2026 04:00

Forschung

LLM-gesteuerte Agenten zeigen echte Engagement‑Mechanismen – kontrollierte Tests enthüllen Neues Forschungsergebnis aus dem Bereich der agentenbasierten Simulationen zeigt, dass große Sprachmodelle (LLMs) nicht nur flüssige, menschenähnliche Texte erzeugen, sondern auch echte, theorieorientierte Verhaltensmuster reproduzieren können. In einer Weibo‑ähnlichen Testumgebung wurden die Agenten gezielt mit unterschiedlichen Informationsmengen und sozialen Normen konfrontiert, während Likes und Reshares

arXiv – cs.AI 24.03.2026 04:00

Forschung

LLM-gesteuertes Multi-Agent-Modell erklärt Schüler-Wahrnehmung

Ein neues Forschungsprojekt nutzt große Sprachmodelle (LLM), um zu zeigen, wie Schüler in realen Klassenräumen unterschiedliche soziale Wah…

arXiv – cs.AI 24.03.2026 04:00

Forschung

KI lernt, Gegenbeispiele zu finden: LLMs erzeugen formale Gegenbeweise

Mathematisches Denken erfordert zwei zentrale Fähigkeiten: das Erstellen rigoroser Beweise für wahre Aussagen und das Aufspüren von Gegenbe…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Neues Framework steigert Langzeitplanung von LLM-Agenten um 10 %

In der Welt der künstlichen Intelligenz haben sich große Sprachmodelle (LLMs) zu leistungsstarken autonomen Agenten entwickelt, die digital…

arXiv – cs.AI 23.03.2026 04:00

Forschung

LJ-Bench: Ontologie-basierter Benchmark für US-Strafrecht

Die Gefahr, dass große Sprachmodelle (LLMs) schädliche Informationen liefern, bleibt ein zentrales Problem, weil sie mit einer breiten Pale…

arXiv – cs.LG 24.03.2026 04:00

Forschung

Prompt-Optimierung als Jailbreak: Adaptive Red-Teaming für LLMs

In der heutigen KI-Landschaft werden große Sprachmodelle (LLMs) immer häufiger in kritischen Anwendungen eingesetzt. Damit die Sicherheit d…

arXiv – cs.AI 23.03.2026 04:00

Forschung

GeoChallenge: 90.000 neue Geometrie-Aufgaben testen KI-Logik

Ein neues Benchmark-Dataset namens GeoChallenge hat die Welt der KI-gestützten Geometrie auf den Kopf gestellt. Mit 90.000 automatisch gene…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Von strukturellen GraphRAG-Ansätzen profitieren automatisierte Kurzantwortbewertungen

Automatisierte Kurzantwortbewertung (ASAG) ist entscheidend für die Skalierung von Bildungsprüfungen, doch große Sprachmodelle (LLMs) neige…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Mid-Training von LLMs verbessert Zusammenfassung radiologischer Berichte

Radiologieberichte sind oft umfangreich und erfordern viel Zeit für die Interpretation. Eine präzise und schnelle Zusammenfassung kann den…

arXiv – cs.AI 23.03.2026 04:00

Forschung

LLMs lernen dynamische Glaubensgraphen für Theory-of-Mind-Logik Neues Modell für große Sprachmodelle (LLMs) ermöglicht es, die sich ständig verändernden inneren Überzeugungen von Menschen zu erfassen und daraus ihre Entscheidungen abzuleiten. Während frühere Ansätze die Glaubenszustände als statisch und unabhängig betrachteten, nutzt das neue Verfahren einen strukturierten kognitiven Trajektorienmodell, das die mentale Zustandsentwicklung als dynamischen Glaubensgraphen darstellt. Dabei werden gle

arXiv – cs.AI 23.03.2026 04:00

Forschung

GenAI erweitert PRISMA: Automatisierte Systematik für Reviews Das PRISMA‑Framework bildet die Grundlage für systematische Übersichtsarbeiten, doch die manuellen Schritte der Datenerfassung und Literatursuche bleiben zeitintensiv und begrenzt. In einer Zeit, in der generative KI‑Modelle – insbesondere große Sprachmodelle – immer leistungsfähiger werden, eröffnet sich die Chance, diese Prozesse zu automatisieren und dadurch die Effizienz deutlich zu steigern. Die Autoren des Preprints arXiv:2

arXiv – cs.AI 23.03.2026 04:00

Forschung

Human-Centered Workflow für die Nutzung von LLMs in der Inhaltsanalyse

Viele Forscher greifen heute auf große Sprachmodelle (LLMs) über Chat‑Schnittstellen zu, doch das wahre Potenzial entfaltet sich erst, wenn…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Automatisierte Interpretationsagenten: Herausforderungen bei der Bewertung

Automatisierte Interpretationssysteme sollen den Bedarf an menschlicher Arbeit reduzieren und die Analyse immer größerer Modelle und vielfä…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Transformers: Das neue, zustandslose Differenzierbare Neuronale Computer

Die Differenzierbaren Neuronalen Computer (DNCs) wurden ursprünglich als rekurrente Architekturen mit einer adressierbaren externen Speiche…

arXiv – cs.AI 23.03.2026 04:00

Finde Modelle, Firmen und Themen

Kleine Sprachmodelle meistern NL2SQL dank Chain‑of‑Thought‑Fine‑Tuning

Neuer, trainingsfreier Halluzinationsdetektor für große Sprachmodelle

Chain-of-Authorization: LLMs übernehmen Autorisierungslogik

LLM-Agenten: Von statischen Vorlagen zu dynamischen Laufzeitgraphen

KI-Agenten formen Stellungen: Neue Messgrößen zeigen Identitätsbildung

Bitte geben Sie den zu übersetzenden Inhalt an.

TinyLoRA: 13‑Parameter‑Fine‑Tuning erreicht 91,8 % bei GSM8K auf Qwen2.5‑7B

LH-Bench: Neue Benchmark für subjektive Unternehmensaufgaben

LLM‑Diagnostik trennt Diagnose von Kontrolle: Policy‑Anpassung in Agenten‑Sim

KLDrive: Wissensgraph-gestützte 3D-Scene-Analyse für autonomes Fahren

Paged Attention: GPU‑Speicheroptimierung für große Sprachmodelle

KI-gestützte Simulation von Polyamorie-Systemen zur Steigerung der Geburtenrate

Neues Framework „Graph of States“ löst abduktive Aufgaben mit LLMs

AE-LLM: Automatisierte Effizienzoptimierung für große Sprachmodelle

LLM-gesteuertes Multi-Agent-Modell erklärt Schüler-Wahrnehmung

KI lernt, Gegenbeispiele zu finden: LLMs erzeugen formale Gegenbeweise

Neues Framework steigert Langzeitplanung von LLM-Agenten um 10 %

LJ-Bench: Ontologie-basierter Benchmark für US-Strafrecht

Prompt-Optimierung als Jailbreak: Adaptive Red-Teaming für LLMs

GeoChallenge: 90.000 neue Geometrie-Aufgaben testen KI-Logik

Von strukturellen GraphRAG-Ansätzen profitieren automatisierte Kurzantwortbewertungen

Mid-Training von LLMs verbessert Zusammenfassung radiologischer Berichte

Human-Centered Workflow für die Nutzung von LLMs in der Inhaltsanalyse

Automatisierte Interpretationsagenten: Herausforderungen bei der Bewertung

Transformers: Das neue, zustandslose Differenzierbare Neuronale Computer

🍪 Cookie-Einstellungen

TinyLoRA: 13‑Parameter‑Fine‑Tuning erreicht 91,8 % bei GSM8K auf Qwen2.5‑7B

Neues Framework steigert Langzeitplanung von LLM-Agenten um 10 %