Suche nach Sprachmodell

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

In der Forschung zu großen Sprachmodellen (LLMs) hat sich gezeigt, dass klassische Techniken wie supervised fine‑tuning (SFT) und reinforce…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EpisTwin: Neuro-Symbolische Architektur für verlässliche persönliche KI

Die Entwicklung von persönlicher Künstlicher Intelligenz wird derzeit durch die Fragmentierung von Nutzerdaten in isolierten Silos behinder…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLM-gestützte Planung mit PDDL-Simulation: Neue Erkenntnisse In einer aktuellen Studie wird untersucht, ob große Sprachmodelle (LLMs) als effektive Planer für autonome Robotiksysteme fungieren können. Dazu wurde PyPDDLEngine entwickelt – ein Open‑Source‑Simulationswerkzeug für die Planning Domain Definition Language (PDDL), das LLMs über ein Model Context Protocol (MCP) als Tool‑Calls nutzen lässt. Im Gegensatz zu herkömmlichen Planern, die einen kompletten Aktionsplan auf einmal generieren

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs ermöglichen flexible, aber deterministische wissenschaftliche Workflows Neues Forschungspapier auf arXiv zeigt, dass große Sprachmodelle (LLMs) inzwischen in der Lage sind, die Ziele von Forschern in klare, ausführbare Befehle zu übersetzen. Gleichzeitig stellen wissenschaftliche Workflows hohe Anforderungen an Determinismus, Nachvollziehbarkeit und Governance – Eigenschaften, die schwer zu garantieren sind, wenn ein LLM selbst entscheidet, was ausgeführt wird. Durch halbstrukturierte

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

In einer aktuellen Untersuchung wurde gezeigt, dass große Sprachmodelle, die immer häufiger für alltägliche moralische Ratschläge eingesetz…

arXiv – cs.AI 09.03.2026 04:00

Forschung

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Die Suche nach Gegenständen in unstrukturierten Haushaltsumgebungen erfordert ein tiefes Verständnis der semantischen Beziehungen zwischen…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neues Benchmark NGDBench: KI trifft komplexe Graphdatenbanken

Während KI‑Systeme enorme Fortschritte beim Verarbeiten von unstrukturiertem Text erzielen, bleiben strukturierte Daten wie Graphen in Date…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Eine neue Studie aus dem arXiv-Preprint arXiv:2603.03668v1 zeigt, dass große Sprachmodelle (LLMs) die Bearbeitung von Constraints mit induk…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

In der neuesten Studie von arXiv (2603.05829v1) wird die Testzeit-Anpassung von großen Sprachmodellen (LLMs) durch viele-Beispiel-Prompting…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Ein verkörperter Begleiter für visuelles Storytelling

Mit dem neuen System Companion wird die Rolle von KI in der Kunst neu definiert: Statt lediglich als Werkzeug zu fungieren, arbeitet der Ze…

arXiv – cs.AI 09.03.2026 04:00

Forschung

KI revolutioniert Wetter- und Klimadaten – Gefahr für globale Ungleichheit

Die rasche Einführung von Künstlicher Intelligenz in der Erdsystemforschung verspricht bislang ungeahnte Geschwindigkeit und Genauigkeit be…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Die Gewinnung von Erkenntnissen aus elektronischen Gesundheitsakten (EHR) erfordert häufig SQL-Kenntnisse, was die Entscheidungsfindung im…

arXiv – cs.AI 09.03.2026 04:00

Praxis

<h1>LLMs fördern nicht nur bekannte Technologien – neue Tools kommen durch</h1> Ein häufiges Anliegen bei der Nutzung von Sprachmodellen für die Programmierung ist, dass sie die Wahl der Technologie zu denjenigen Werkzeugen verlagern, die am besten in den Trainingsdaten vertreten sind. Dadurch könnten neue, bessere Tools im Hintergrund bleiben. In den letzten Jahren zeigte sich das besonders bei Python oder JavaScript, die deutlich bessere Ergebnisse lieferten als weniger verbreitete Sprachen. Mit

Simon Willison – Blog 09.03.2026 13:37

Forschung

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

In einer kürzlich veröffentlichten Arbeit auf arXiv (2603.06138v1) wird ein innovativer Ansatz vorgestellt, der Reinforcement Learning (RL)…

arXiv – cs.LG 09.03.2026 04:00

Forschung

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

Die Ptychographie ist eine hochpräzise Bildgebungstechnik, die in der Materialforschung weit verbreitet ist. Damit die Rekonstruktionen jed…

arXiv – cs.AI 09.03.2026 04:00

Forschung

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

Die neueste Veröffentlichung von EigenData präsentiert eine selbstlernende Multi-Agent-Plattform, die den gesamten Lebenszyklus von Trainin…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neue Methode: Gated Behavior Trees sichern LLM-Agenten Forscher haben eine neue Technik namens Traversal-as-Policy entwickelt, die die Sicherheit und Effizienz von großen Sprachmodell-Agenten deutlich verbessert. Dabei werden die Ausführungsprotokolle von OpenHands in einen einzigen, ausführbaren Gated Behavior Tree (GBT) überführt. Anstelle der üblichen, unkontrollierten Textgenerierung steuert der Agent nun die Aufgabe durch Traversierung dieses Baumes. Jeder Knoten im GBT repräsentiert ein au

arXiv – cs.AI 09.03.2026 04:00

Forschung

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

Die Bewertung von Produktkonzepten ist ein entscheidender Schritt, der die strategische Ressourcenallokation und den Projekterfolg in Unter…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Best-of-N Sampling bleibt optimal – neue Variante verhindert Reward‑Hacking

In einer aktuellen Studie zum Inferenzzeit‑Alignment von Sprachmodellen wird das beliebte Best‑of‑N (BoN) Sampling erneut untersucht. Das V…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Die neuesten Sparse Mixture-of-Experts (SMoE) Sprachmodelle kombinieren starke Leistungsfähigkeit mit geringer pro‑Token‑Rechenlast. In der…

arXiv – cs.LG 09.03.2026 04:00

Forschung

DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 % In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar. Der D

arXiv – cs.AI 06.03.2026 05:00

Forschung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

In einer bahnbrechenden Untersuchung wurden vier vorregistrierte Studien mit insgesamt 1 584 Multi-Agent-Simulationen durchgeführt, die 16…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

Manipulative Kommunikation – von Gaslighting über Schuldzuweisungen bis hin zu emotionaler Zwangsausübung – bleibt für viele Menschen schw…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Ein neues arXiv-Papier (2603.04741v1) präsentiert CONE, ein hybrides Transformer‑Encoder-Modell, das speziell dafür entwickelt wurde, numer…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

Standard Retrieval‑Augmented Generation (RAG) Modelle stoßen in hochriskanten Finanzanwendungen an ihre Grenzen. Sie können weder präzise a…

arXiv – cs.LG 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

In einer neuen Studie wird die bisherige Symmetrie im Transformer‑Attention‑Mechanismus in Frage gestellt. Während klassische Modelle diese…

arXiv – cs.LG 06.03.2026 05:00

Forschung

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

Die Entwicklung von GUI-Agenten steht bislang vor zwei großen Hindernissen: Entweder greifen sie auf unsichere, nicht reproduzierbare Live-…

arXiv – cs.AI 06.03.2026 05:00

Forschung

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

Agentische Systeme nutzen zunehmend Sprachmodelle, um ihr eigenes Verhalten zu überwachen. Dabei prüfen Coding‑Agenten beispielsweise den v…

arXiv – cs.AI 06.03.2026 05:00

Finde Modelle, Firmen und Themen

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

EpisTwin: Neuro-Symbolische Architektur für verlässliche persönliche KI

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Neues Benchmark NGDBench: KI trifft komplexe Graphdatenbanken

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

Ein verkörperter Begleiter für visuelles Storytelling

KI revolutioniert Wetter- und Klimadaten – Gefahr für globale Ungleichheit

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

Best-of-N Sampling bleibt optimal – neue Variante verhindert Reward‑Hacking

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

🍪 Cookie-Einstellungen

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %