Suche nach Sprachmodelle

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

In der Forschung zu großen Sprachmodellen (LLMs) hat sich gezeigt, dass klassische Techniken wie supervised fine‑tuning (SFT) und reinforce…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EpisTwin: Neuro-Symbolische Architektur für verlässliche persönliche KI

Die Entwicklung von persönlicher Künstlicher Intelligenz wird derzeit durch die Fragmentierung von Nutzerdaten in isolierten Silos behinder…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLM-gestützte Planung mit PDDL-Simulation: Neue Erkenntnisse In einer aktuellen Studie wird untersucht, ob große Sprachmodelle (LLMs) als effektive Planer für autonome Robotiksysteme fungieren können. Dazu wurde PyPDDLEngine entwickelt – ein Open‑Source‑Simulationswerkzeug für die Planning Domain Definition Language (PDDL), das LLMs über ein Model Context Protocol (MCP) als Tool‑Calls nutzen lässt. Im Gegensatz zu herkömmlichen Planern, die einen kompletten Aktionsplan auf einmal generieren

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs ermöglichen flexible, aber deterministische wissenschaftliche Workflows Neues Forschungspapier auf arXiv zeigt, dass große Sprachmodelle (LLMs) inzwischen in der Lage sind, die Ziele von Forschern in klare, ausführbare Befehle zu übersetzen. Gleichzeitig stellen wissenschaftliche Workflows hohe Anforderungen an Determinismus, Nachvollziehbarkeit und Governance – Eigenschaften, die schwer zu garantieren sind, wenn ein LLM selbst entscheidet, was ausgeführt wird. Durch halbstrukturierte

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

In einer aktuellen Untersuchung wurde gezeigt, dass große Sprachmodelle, die immer häufiger für alltägliche moralische Ratschläge eingesetz…

arXiv – cs.AI 09.03.2026 04:00

Forschung

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Die Suche nach Gegenständen in unstrukturierten Haushaltsumgebungen erfordert ein tiefes Verständnis der semantischen Beziehungen zwischen…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neues Benchmark NGDBench: KI trifft komplexe Graphdatenbanken

Während KI‑Systeme enorme Fortschritte beim Verarbeiten von unstrukturiertem Text erzielen, bleiben strukturierte Daten wie Graphen in Date…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Eine neue Studie aus dem arXiv-Preprint arXiv:2603.03668v1 zeigt, dass große Sprachmodelle (LLMs) die Bearbeitung von Constraints mit induk…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

In der neuesten Studie von arXiv (2603.05829v1) wird die Testzeit-Anpassung von großen Sprachmodellen (LLMs) durch viele-Beispiel-Prompting…

arXiv – cs.LG 09.03.2026 04:00

Forschung

KI revolutioniert Wetter- und Klimadaten – Gefahr für globale Ungleichheit

Die rasche Einführung von Künstlicher Intelligenz in der Erdsystemforschung verspricht bislang ungeahnte Geschwindigkeit und Genauigkeit be…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Die Gewinnung von Erkenntnissen aus elektronischen Gesundheitsakten (EHR) erfordert häufig SQL-Kenntnisse, was die Entscheidungsfindung im…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

In einer kürzlich veröffentlichten Arbeit auf arXiv (2603.06138v1) wird ein innovativer Ansatz vorgestellt, der Reinforcement Learning (RL)…

arXiv – cs.LG 09.03.2026 04:00

Forschung

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

Die Ptychographie ist eine hochpräzise Bildgebungstechnik, die in der Materialforschung weit verbreitet ist. Damit die Rekonstruktionen jed…

arXiv – cs.AI 09.03.2026 04:00

Forschung

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

Die neueste Veröffentlichung von EigenData präsentiert eine selbstlernende Multi-Agent-Plattform, die den gesamten Lebenszyklus von Trainin…

arXiv – cs.AI 09.03.2026 04:00

Forschung

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

Die Bewertung von Produktkonzepten ist ein entscheidender Schritt, der die strategische Ressourcenallokation und den Projekterfolg in Unter…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Best-of-N Sampling bleibt optimal – neue Variante verhindert Reward‑Hacking

In einer aktuellen Studie zum Inferenzzeit‑Alignment von Sprachmodellen wird das beliebte Best‑of‑N (BoN) Sampling erneut untersucht. Das V…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Die neuesten Sparse Mixture-of-Experts (SMoE) Sprachmodelle kombinieren starke Leistungsfähigkeit mit geringer pro‑Token‑Rechenlast. In der…

arXiv – cs.LG 09.03.2026 04:00

Forschung

DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 % In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar. Der D

arXiv – cs.AI 06.03.2026 05:00

Forschung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

In einer bahnbrechenden Untersuchung wurden vier vorregistrierte Studien mit insgesamt 1 584 Multi-Agent-Simulationen durchgeführt, die 16…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Ein neues arXiv-Papier (2603.04741v1) präsentiert CONE, ein hybrides Transformer‑Encoder-Modell, das speziell dafür entwickelt wurde, numer…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

In einer neuen Studie wird die bisherige Symmetrie im Transformer‑Attention‑Mechanismus in Frage gestellt. Während klassische Modelle diese…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

Agentische Systeme nutzen zunehmend Sprachmodelle, um ihr eigenes Verhalten zu überwachen. Dabei prüfen Coding‑Agenten beispielsweise den v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

Die quadratische Komplexität der Selbst‑Attention‑Phase behindert die Nutzung von Sprachmodellen mit sehr langen Kontexten. Bestehende Spar…

arXiv – cs.LG 06.03.2026 05:00

Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen. Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Forschung

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

In der Welt der großen Sprachmodelle (LLMs) eröffnet federiertes Feintuning die Möglichkeit, Modelle über verteilte Clients hinweg gemeinsa…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

In der Welt der großen Sprachmodelle (LLMs) ist die Stabilität beim Reinforcement Learning entscheidend. Traditionell sorgt das Clipping‑Ve…

arXiv – cs.LG 06.03.2026 05:00

Forschung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

Die präzise und nachvollziehbare Diagnose von Lebererkrankungen ist von entscheidender Bedeutung, stellt jedoch in der Praxis weiterhin ein…

arXiv – cs.AI 06.03.2026 05:00

Finde Modelle, Firmen und Themen

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

EpisTwin: Neuro-Symbolische Architektur für verlässliche persönliche KI

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Neues Benchmark NGDBench: KI trifft komplexe Graphdatenbanken

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

KI revolutioniert Wetter- und Klimadaten – Gefahr für globale Ungleichheit

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

Best-of-N Sampling bleibt optimal – neue Variante verhindert Reward‑Hacking

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

🍪 Cookie-Einstellungen

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %