Suche nach LLMs | meineki.news

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

In der Forschung zu großen Sprachmodellen (LLMs) hat sich gezeigt, dass klassische Techniken wie supervised fine‑tuning (SFT) und reinforce…

arXiv – cs.LG 09.03.2026 04:00

Forschung

LLM-gestützte Planung mit PDDL-Simulation: Neue Erkenntnisse In einer aktuellen Studie wird untersucht, ob große Sprachmodelle (LLMs) als effektive Planer für autonome Robotiksysteme fungieren können. Dazu wurde PyPDDLEngine entwickelt – ein Open‑Source‑Simulationswerkzeug für die Planning Domain Definition Language (PDDL), das LLMs über ein Model Context Protocol (MCP) als Tool‑Calls nutzen lässt. Im Gegensatz zu herkömmlichen Planern, die einen kompletten Aktionsplan auf einmal generieren

arXiv – cs.AI 09.03.2026 04:00

Forschung

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

Large Language Models (LLMs) haben in der natürlichen Sprachverarbeitung enorme Fortschritte erzielt, doch ihre Anwendung in der Hardware‑S…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs ermöglichen flexible, aber deterministische wissenschaftliche Workflows Neues Forschungspapier auf arXiv zeigt, dass große Sprachmodelle (LLMs) inzwischen in der Lage sind, die Ziele von Forschern in klare, ausführbare Befehle zu übersetzen. Gleichzeitig stellen wissenschaftliche Workflows hohe Anforderungen an Determinismus, Nachvollziehbarkeit und Governance – Eigenschaften, die schwer zu garantieren sind, wenn ein LLM selbst entscheidet, was ausgeführt wird. Durch halbstrukturierte

arXiv – cs.AI 09.03.2026 04:00

Forschung

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Die Suche nach Gegenständen in unstrukturierten Haushaltsumgebungen erfordert ein tiefes Verständnis der semantischen Beziehungen zwischen…

arXiv – cs.AI 09.03.2026 04:00

Praxis

Google führt Bayesian-Upgrade ein: Neue Lernmethode stärkt LLM-Logik

Large Language Models sind hervorragende Nachahmer, doch wenn es darum geht, ihre Überzeugungen anhand neuer Daten zu aktualisieren, zeigen…

MarkTechPost 09.03.2026 08:23

Forschung

KI-Revolution: Herausforderungen und Chancen bei Mensch‑Daten‑Interaktion

Die rasante Entwicklung von Künstlicher Intelligenz verändert die Art und Weise, wie wir mit Daten arbeiten. Menschzentrierte Systeme werde…

arXiv – cs.AI 09.03.2026 04:00

Forschung

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Eine neue Studie aus dem arXiv-Preprint arXiv:2603.03668v1 zeigt, dass große Sprachmodelle (LLMs) die Bearbeitung von Constraints mit induk…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

In der neuesten Studie von arXiv (2603.05829v1) wird die Testzeit-Anpassung von großen Sprachmodellen (LLMs) durch viele-Beispiel-Prompting…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Die Gewinnung von Erkenntnissen aus elektronischen Gesundheitsakten (EHR) erfordert häufig SQL-Kenntnisse, was die Entscheidungsfindung im…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

In einer kürzlich veröffentlichten Arbeit auf arXiv (2603.06138v1) wird ein innovativer Ansatz vorgestellt, der Reinforcement Learning (RL)…

arXiv – cs.LG 09.03.2026 04:00

Forschung

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

Die Ptychographie ist eine hochpräzise Bildgebungstechnik, die in der Materialforschung weit verbreitet ist. Damit die Rekonstruktionen jed…

arXiv – cs.AI 09.03.2026 04:00

Forschung

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

VDCook ist ein selbstentwickelndes Video‑Datenbetriebssystem, das Forschern und Fachteams eine vollständig konfigurierbare Plattform bietet…

arXiv – cs.AI 09.03.2026 04:00

Forschung

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

Autonome Coding‑Agenten können in kurzer Zeit starke Baselines für tabellarische Aufgaben erzeugen – ähnlich wie bei Kaggle‑Wettbewerben. D…

arXiv – cs.LG 09.03.2026 04:00

Forschung

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Die neuesten Sparse Mixture-of-Experts (SMoE) Sprachmodelle kombinieren starke Leistungsfähigkeit mit geringer pro‑Token‑Rechenlast. In der…

arXiv – cs.LG 09.03.2026 04:00

Praxis

Google präsentiert Android Bench – neues LLM-Benchmark für Android

Google hat Android Bench veröffentlicht, ein neues Leaderboard und Evaluationsframework, das speziell darauf abzielt, die Leistung von Larg…

MarkTechPost 06.03.2026 19:53

Forschung

DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 % In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar. Der D

arXiv – cs.AI 06.03.2026 05:00

Forschung

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Ein neues Verfahren namens VISA (Value Injection via Shielded Adaptation) verspricht, Large Language Models (LLMs) genauer an menschliche W…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Automatisierte Datenauswertung: KI-gestütztes Risikobewertungs-Framework

Large Language Models (LLMs) werden zunehmend in kritische Entscheidungsprozesse eingebunden, was die Nachfrage nach zuverlässiger und auto…

arXiv – cs.AI 06.03.2026 05:00

Forschung

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

In der autonomen Fahrsimulation steht die Erzeugung realistischer und vielfältiger Fahrtrajektorien im Fokus. K-Gen, ein multimodales Sprac…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen. Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Forschung

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

In der Welt der großen Sprachmodelle (LLMs) eröffnet federiertes Feintuning die Möglichkeit, Modelle über verteilte Clients hinweg gemeinsa…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

In der Welt der großen Sprachmodelle (LLMs) ist die Stabilität beim Reinforcement Learning entscheidend. Traditionell sorgt das Clipping‑Ve…

arXiv – cs.LG 06.03.2026 05:00

Forschung

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

Mit dem Übergang von reinen Chatbots zu agentischen Assistenten zeigen große Sprachmodelle (LLMs) zunehmend riskante Verhaltensweisen, wenn…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

In der Computational Psychiatry besteht seit langem ein Spannungsfeld zwischen Modellen, die leicht zu verstehen sind, und solchen, die men…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Mehrstufige Theoremvorhersage dank struktureller Priors In der automatisierten Beweistechnik stellt die Vorhersage von mehrstufigen Theoremen eine zentrale Herausforderung dar. Traditionelle neuronale‑symbolische Ansätze setzen stark auf überwachungsbasierte, parametrisierte Modelle, die jedoch bei sich wandelnden Theorem-Bibliotheken nur begrenzte Generalisierung zeigen. In einer neuen Studie wird ein komplett trainingsfreier Ansatz vorgestellt, der auf In‑Context‑Learning (ICL) bas

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neues Benchmark-Framework Mind-ParaWorld bewertet Suchagenten in einer Parallelwelt

Die Integration von Web‑Suchtools hat die Leistungsfähigkeit von großen Sprachmodellen (LLMs) enorm erweitert, sodass sie jetzt offene, zei…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>LLM-Agenten erzeugen Propaganda – Wir testen Gegenmaßnahmen</h1> In einer aktuellen arXiv‑Studie wird gezeigt, dass große Sprachmodelle (LLMs), die als Agenten in offenen Umgebungen eingesetzt werden, leicht manipulativ eingesetzt werden können. Die Forscher haben die Modelle gezielt mit Propagandazielen konfrontiert, um zu prüfen, wie stark sie in der Lage sind, manipulative Inhalte zu generieren. Zur Analyse der erzeugten Texte kamen zwei spezialisierte Modelle zum Einsatz: eines, das Texte

arXiv – cs.AI 06.03.2026 05:00

Finde Modelle, Firmen und Themen

LLM-gestützte Moleküloptimierung: Neue Methode RePO steigert Effizienz

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

SCOUT: 3D-Graphen für effiziente Objektsuche im offenen Raum

Google führt Bayesian-Upgrade ein: Neue Lernmethode stärkt LLM-Logik

KI-Revolution: Herausforderungen und Chancen bei Mensch‑Daten‑Interaktion

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Teilweise Policy-Gradienten: Neue RL-Strategien für LLMs

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Google präsentiert Android Bench – neues LLM-Benchmark für Android

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Automatisierte Datenauswertung: KI-gestütztes Risikobewertungs-Framework

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

Neues Benchmark-Framework Mind-ParaWorld bewertet Suchagenten in einer Parallelwelt

🍪 Cookie-Einstellungen

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

LLMs verbessern die Lösung von Constraints mit induktiven Definitionen um 25 %