Suche nach LLM | meineki.news

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

In der Forschung zu großen Sprachmodellen (LLMs) hat sich gezeigt, dass klassische Techniken wie supervised fine‑tuning (SFT) und reinforce…

arXiv – cs.LG 09.03.2026 04:00

Forschung

LLM-gestützte Planung mit PDDL-Simulation: Neue Erkenntnisse In einer aktuellen Studie wird untersucht, ob große Sprachmodelle (LLMs) als effektive Planer für autonome Robotiksysteme fungieren können. Dazu wurde PyPDDLEngine entwickelt – ein Open‑Source‑Simulationswerkzeug für die Planning Domain Definition Language (PDDL), das LLMs über ein Model Context Protocol (MCP) als Tool‑Calls nutzen lässt. Im Gegensatz zu herkömmlichen Planern, die einen kompletten Aktionsplan auf einmal generieren

arXiv – cs.AI 09.03.2026 04:00

Forschung

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

Large Language Models (LLMs) haben in der natürlichen Sprachverarbeitung enorme Fortschritte erzielt, doch ihre Anwendung in der Hardware‑S…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs ermöglichen flexible, aber deterministische wissenschaftliche Workflows Neues Forschungspapier auf arXiv zeigt, dass große Sprachmodelle (LLMs) inzwischen in der Lage sind, die Ziele von Forschern in klare, ausführbare Befehle zu übersetzen. Gleichzeitig stellen wissenschaftliche Workflows hohe Anforderungen an Determinismus, Nachvollziehbarkeit und Governance – Eigenschaften, die schwer zu garantieren sind, wenn ein LLM selbst entscheidet, was ausgeführt wird. Durch halbstrukturierte

arXiv – cs.AI 09.03.2026 04:00

Praxis

Andrej Karpathy stellt 'Autoresearch' vor: 630 Zeilen Python ML-Tests auf einer GPU

Andrej Karpathy hat ein neues, schlankes Python-Tool namens autoresearch veröffentlicht, das es KI-Agenten ermöglicht, eigenständig Machine…

MarkTechPost 09.03.2026 02:47

Forschung

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

In einer aktuellen Untersuchung wurde gezeigt, dass große Sprachmodelle, die immer häufiger für alltägliche moralische Ratschläge eingesetz…

arXiv – cs.AI 09.03.2026 04:00

Forschung

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Die Suche nach Gegenständen in unstrukturierten Haushaltsumgebungen erfordert ein tiefes Verständnis der semantischen Beziehungen zwischen…

arXiv – cs.AI 09.03.2026 04:00

Praxis

Google führt Bayesian-Upgrade ein: Neue Lernmethode stärkt LLM-Logik

Large Language Models sind hervorragende Nachahmer, doch wenn es darum geht, ihre Überzeugungen anhand neuer Daten zu aktualisieren, zeigen…

MarkTechPost 09.03.2026 08:23

Forschung

Selbstlernende Medizinagenten verbessern Bilddiagnostik durch Erfahrung In einer kürzlich veröffentlichten Studie auf arXiv wird ein neues System namens MACRO vorgestellt, das die Art und Weise revolutioniert, wie KI-gestützte Agenten medizinische Bilddaten interpretieren. Während herkömmliche Large‑Language‑Modelle (LLM) ihre Tool‑Ketten nach dem Deployment festlegen und damit bei Änderungen im klinischen Umfeld schnell an Genauigkeit verlieren, lernt MACRO kontinuierlich aus vergangenen Ausführu

arXiv – cs.AI 09.03.2026 04:00

Forschung

KI-Revolution: Herausforderungen und Chancen bei Mensch‑Daten‑Interaktion

Die rasante Entwicklung von Künstlicher Intelligenz verändert die Art und Weise, wie wir mit Daten arbeiten. Menschzentrierte Systeme werde…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Eine neue Studie aus dem arXiv-Preprint arXiv:2603.03668v1 zeigt, dass große Sprachmodelle (LLMs) die Bearbeitung von Constraints mit induk…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

In der neuesten Studie von arXiv (2603.05829v1) wird die Testzeit-Anpassung von großen Sprachmodellen (LLMs) durch viele-Beispiel-Prompting…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Die Gewinnung von Erkenntnissen aus elektronischen Gesundheitsakten (EHR) erfordert häufig SQL-Kenntnisse, was die Entscheidungsfindung im…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

In einer kürzlich veröffentlichten Arbeit auf arXiv (2603.06138v1) wird ein innovativer Ansatz vorgestellt, der Reinforcement Learning (RL)…

arXiv – cs.LG 09.03.2026 04:00

Forschung

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

Die Ptychographie ist eine hochpräzise Bildgebungstechnik, die in der Materialforschung weit verbreitet ist. Damit die Rekonstruktionen jed…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neue Methode: Gated Behavior Trees sichern LLM-Agenten Forscher haben eine neue Technik namens Traversal-as-Policy entwickelt, die die Sicherheit und Effizienz von großen Sprachmodell-Agenten deutlich verbessert. Dabei werden die Ausführungsprotokolle von OpenHands in einen einzigen, ausführbaren Gated Behavior Tree (GBT) überführt. Anstelle der üblichen, unkontrollierten Textgenerierung steuert der Agent nun die Aufgabe durch Traversierung dieses Baumes. Jeder Knoten im GBT repräsentiert ein au

arXiv – cs.AI 09.03.2026 04:00

Forschung

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

VDCook ist ein selbstentwickelndes Video‑Datenbetriebssystem, das Forschern und Fachteams eine vollständig konfigurierbare Plattform bietet…

arXiv – cs.AI 09.03.2026 04:00

Forschung

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

Die Bewertung von Produktkonzepten ist ein entscheidender Schritt, der die strategische Ressourcenallokation und den Projekterfolg in Unter…

arXiv – cs.AI 09.03.2026 04:00

Forschung

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

Autonome Coding‑Agenten können in kurzer Zeit starke Baselines für tabellarische Aufgaben erzeugen – ähnlich wie bei Kaggle‑Wettbewerben. D…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Die neuesten Sparse Mixture-of-Experts (SMoE) Sprachmodelle kombinieren starke Leistungsfähigkeit mit geringer pro‑Token‑Rechenlast. In der…

arXiv – cs.LG 09.03.2026 04:00

Praxis

Google präsentiert Android Bench – neues LLM-Benchmark für Android

Google hat Android Bench veröffentlicht, ein neues Leaderboard und Evaluationsframework, das speziell darauf abzielt, die Leistung von Larg…

MarkTechPost 06.03.2026 19:53

Forschung

DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 % In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar. Der D

arXiv – cs.AI 06.03.2026 05:00

Forschung

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Ein neues Verfahren namens VISA (Value Injection via Shielded Adaptation) verspricht, Large Language Models (LLMs) genauer an menschliche W…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Persistente KV-Cache: Multi-Agent-LLM auf Edge-Geräten effizienter

Multi-Agent-LLM-Systeme, die auf Edge-Geräten laufen, stoßen häufig an die Grenzen des verfügbaren RAMs. Auf einem Apple M4 Pro mit einem C…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

In einer bahnbrechenden Untersuchung wurden vier vorregistrierte Studien mit insgesamt 1 584 Multi-Agent-Simulationen durchgeführt, die 16…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

Manipulative Kommunikation – von Gaslighting über Schuldzuweisungen bis hin zu emotionaler Zwangsausübung – bleibt für viele Menschen schw…

arXiv – cs.AI 06.03.2026 05:00

Aktuell

Pentagon darf mit KI US‑Bürger überwachen? Gesetzliche Grenzen im Fokus

Der anhaltende Streit zwischen dem Verteidigungsministerium und dem KI‑Unternehmen Anthropic wirft eine zentrale Frage auf: Erlaubt das US‑…

MIT Technology Review – Artificial Intelligence 06.03.2026 19:21

Forschung

Neues KI-Modell liefert erklärbare Vorhersagen für Hafenüberlastung

Ein innovatives KI-System namens AIS‑TGNN kombiniert ein Temporal Graph Attention Network mit einem strukturierten Large‑Language‑Model, um…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

Die Entwicklung von GUI-Agenten steht bislang vor zwei großen Hindernissen: Entweder greifen sie auf unsichere, nicht reproduzierbare Live-…

arXiv – cs.AI 06.03.2026 05:00

Finde Modelle, Firmen und Themen

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

Andrej Karpathy stellt 'Autoresearch' vor: 630 Zeilen Python ML-Tests auf einer GPU

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Google führt Bayesian-Upgrade ein: Neue Lernmethode stärkt LLM-Logik

KI-Revolution: Herausforderungen und Chancen bei Mensch‑Daten‑Interaktion

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

KI-gesteuertes Multi-Agent-System revolutioniert Produktkonzeptbewertung

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Google präsentiert Android Bench – neues LLM-Benchmark für Android

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Persistente KV-Cache: Multi-Agent-LLM auf Edge-Geräten effizienter

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

Pentagon darf mit KI US‑Bürger überwachen? Gesetzliche Grenzen im Fokus

Neues KI-Modell liefert erklärbare Vorhersagen für Hafenüberlastung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

🍪 Cookie-Einstellungen

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %