Suche nach EU | meineki.news

AlphaLab: Autonomes Forschungssystem mit LLMs revolutioniert Optimierung

AlphaLab ist ein neu entwickeltes, autonomes Forschungssystem, das die neuesten Large‑Language‑Models (LLMs) nutzt, um den gesamten experim…

arXiv – cs.LG 13.04.2026 04:00

Forschung

Neues DACO-Framework stärkt Sicherheit multimodaler Sprachmodelle

Multimodale Large Language Models (MLLMs) sind zunehmend anfällig für böswillige Anfragen, die gefährliche Antworten auslösen können. Tradi…

arXiv – cs.LG 13.04.2026 04:00

Forschung

Spatial‑Gym: Neue Benchmark für räumliches Denken in Robotik und Navigation

In der Robotik und Navigation ist räumliches Denken entscheidend – aber bisher fehlt ein klares Messinstrument. Mit dem neuen Spatial‑Gym…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Neue Benchmark zeigt Schwächen von Open-Weight-LLMs beim mathematischen Denken

Eine aktuelle Studie aus dem arXiv-Repository präsentiert einen robusten Reasoning Benchmark, der die Leistungsfähigkeit von Large Language…

arXiv – cs.AI 13.04.2026 04:00

Forschung

PRAGMA: Transformer-Modell für Finanzdaten

Ein neues Forschungsdokument auf arXiv (2604.08649v1) stellt PRAGMA vor – ein Transformer‑basiertes Basismodell, das speziell für die Analy…

arXiv – cs.LG 13.04.2026 04:00

Forschung

PilotBench: Benchmark für General Aviation Agenten mit Sicherheitsanforderungen

Mit dem Aufkommen von Large Language Models (LLMs) in der realen Welt stellt sich die zentrale Frage: Können Modelle, die ausschließlich au…

arXiv – cs.AI 13.04.2026 04:00

Aktuell

Stärkung der Unternehmensführung bei steigenden Edge‑AI‑Lasten

Mit der Einführung von Modellen wie Google Gemma 4 stehen IT‑Sicherheitschefs vor neuen Herausforderungen, wenn es darum geht, KI‑Workloads…

AI News (TechForge) 13.04.2026 13:02

Forschung

Neurale Modelle revolutionieren die Bewertung von Text‑zu‑Speech-Systemen

Die Sicherstellung, dass Text‑zu‑Speech‑Systeme (TTS) in großem Maßstab die von Menschen wahrgenommene Qualität liefern, bleibt eine zentra…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Temperaturabhängige Leistung von Prompting-Strategien in erweiterten LLMs

Erweiterte Reasoning-Modelle markieren einen Wendepunkt in der Leistungsfähigkeit von Large Language Models (LLMs), indem sie explizite Ber…

arXiv – cs.AI 13.04.2026 04:00

Forschung

LLMs im Medizinbereich: Studie zeigt Lücke zwischen Prüfungs- und Praxisleistung

Eine neue, umfassende Untersuchung zum Einsatz großer Sprachmodelle (LLMs) in der Medizin hat gezeigt, dass die beeindruckenden Ergebnisse…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Automatisierte Metadaten-Standardisierung in der Biomedizin: LLM-Agent liefert präzise Ergebnisse

Ein neues System nutzt große Sprachmodelle, um veraltete biomedizinische Metadaten automatisch zu standardisieren. Durch die Kombination vo…

arXiv – cs.AI 13.04.2026 04:00

Forschung

OpenKedge: Mutationskontrolle für autonome KI – Sicherheit durch Verträge

Autonome KI‑Agenten haben die Schwachstellen herkömmlicher API‑Architekturen ans Licht gebracht: Systeme führen Zustandsänderungen ohne aus…

arXiv – cs.AI 13.04.2026 04:00

Praxis

MiniMax präsentiert MMX-CLI: KI-CLI für Bild, Video, Sprache, Musik, Vision & Suche

MiniMax, das Unternehmen hinter dem Omni‑Modal‑Modellstack, hat die neue MMX‑CLI veröffentlicht. Die Node.js‑basierte Befehlszeilenschnitts…

MarkTechPost 13.04.2026 05:17

Forschung

CSAttention: Centroid-Scoring Attention beschleunigt LLM-Infere

Langzeitkontext-Modelle für Sprachagenten und domänenspezifische Q&A‑Anwendungen setzen zunehmend auf wiederverwendbare Prefill‑Prompts. Da…

arXiv – cs.LG 13.04.2026 04:00

Aktuell

Lehren im Zeitalter von ChatGPT: Ein Kampf gegen Entmoralisation

Die Einführung von Sprachmodellen wie ChatGPT hat die Lehrpraxis grundlegend verändert. Für viele Hochschullehrer bedeutet die zunehmende N…

Ars Technica – AI 13.04.2026 11:00

Forschung

VerifAI: Open-Source-Engine für verifizierbare biomedizinische Antworten

VerifAI ist ein völlig offenes Expertensystem, das die Fragebeantwortung im biomedizinischen Bereich neu definiert. Durch die Kombination v…

arXiv – cs.AI 13.04.2026 04:00

Forschung

SPPO: Neue Methode für effiziente Langzeit-Logik in Sprachmodellen

Proximal Policy Optimization (PPO) ist ein zentrales Werkzeug, um große Sprachmodelle (LLMs) in Aufgaben des logischen Denkens mit überprüf…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Von Geschäftsvorfällen zu prüfbaren Entscheidungen: Ontologie‑Graphsimulation für Unternehmens‑KI

In der heutigen KI-Landschaft stoßen viele LLM-basierte Agentensysteme an eine gemeinsame Schwachstelle: Sie greifen sofort auf ein unbegre…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Neue Methode misst Unsicherheit in Multi-Agenten-Systemen mit Tensorzerlegung

Large‑Language‑Model‑basierte Multi‑Agenten‑Systeme (MAS) übertreffen alleinstehende Agenten bei komplexen Aufgaben, doch ihre vielschichti…

arXiv – cs.LG 13.04.2026 04:00

Forschung

LLM-Textökosysteme: Drift und Auswahl formen die Zukunft des Lernens

In einer neuen Studie wird aufgezeigt, wie das öffentliche Textarchiv – die Quelle, aus der Menschen und KI-Systeme lernen – zunehmend von…

arXiv – cs.AI 13.04.2026 04:00

Forschung

E3-TIR: Effiziente Reasoning-Tools durch gezielte Erfahrungsausnutzung

Die neue Methode E3‑TIR (Enhanced Experience Exploitation for Tool‑Integrated Reasoning) löst die Schwächen bisheriger Trainingsansätze für…

arXiv – cs.AI 13.04.2026 04:00

Forschung

LLM-gestützte Planung: Feedback-Optimierung verbessert Domänenqualität

Ein neues arXiv-Papier (2604.08712v1) beleuchtet ein langjähriges Problem der KI-Forschung: die automatische Erstellung von Planungsdomänen…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Strategische algorithmische Monokultur: Experimentelle Beweise aus Koordinationsspielen

In einer Welt, in der KI-Agenten immer häufiger in komplexen Mehragenten-Umgebungen agieren, wird die Fähigkeit zur Koordination zu einem e…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Neue Diffusionsmethode steigert Effizienz von modellbasiertem Reinforcement Learning

In der Welt des modellbasierten Reinforcement Learning (MBRL) haben autoregressive Weltmodelle lange Zeit mit kumulativen Fehlern zu kämpfe…

arXiv – cs.AI 13.04.2026 04:00

Aktuell

KI-Agenten revolutionieren dein Dating-Leben

Pixel Societies, ein innovatives Entwicklerteam, nutzt KI-Agenten, um soziale Interaktionen realitätsnah zu simulieren. Durch diese Technol…

Wired – AI (Latest) 13.04.2026 10:00

Aktuell

Unternehmen erweitern KI-Einsatz, behalten dabei die Kontrolle

Viele Unternehmen verfolgen einen vorsichtigeren, kontrollierten Ansatz bei der Einführung autonomer Systeme, während die KI-Nutzung weiter…

AI News (TechForge) 13.04.2026 10:00

Forschung

<p>LLMs entscheiden: Wann handeln, wann eskalieren – neue Forschungsergebnisse</p> <p>Eine kürzlich veröffentlichte Studie auf arXiv untersucht, wie Sprachmodelle entscheiden, ob sie in automatisierten Systemen selbst handeln oder die Aufgabe an einen Menschen übergeben. Der Ansatz betrachtet die Entscheidung als Problem der Unsicherheit: Das Modell trifft eine Vorhersage, schätzt die Wahrscheinlichkeit ihrer Richtigkeit und vergleicht die erwarteten Kosten von Handeln und Eskalation.</p> <p>Die Analyse ers

arXiv – cs.LG 13.04.2026 04:00

Forschung

EXPONA: Automatisiertes Labeling mit vielfältiger, zuverlässiger Heuristik

In der Welt des maschinellen Lernens sind hochwertige gelabelte Daten unverzichtbar, doch die manuelle Annotation bleibt teuer und fehleran…

arXiv – cs.AI 13.04.2026 04:00

Forschung

Genomische Modelle kompakt: 200‑fach kleinere mRNA‑Lernmaschine

Die neuesten genomischen Basismodelle haben beeindruckende Ergebnisse erzielt, doch ihre Größe von mehreren Milliarden Parametern macht sie…

arXiv – cs.AI 13.04.2026 04:00

Forschung

<h1>QuanBench+: Mehr-Framework-Benchmark für LLM-basierte Quanten-Codegenerierung</h1> <p>Large Language Models (LLMs) werden zunehmend für die automatische Codegenerierung eingesetzt, jedoch bleibt die Bewertung von Quanten-Code noch stark auf einzelne Frameworks beschränkt. Mit dem neuen Benchmark QuanBench+ wird dieses Problem angegangen: Er verbindet die drei führenden Quanten-Frameworks Qiskit, PennyLane und Cirq in einem einheitlichen Testfeld und umfasst 42 sorgfältig abgestimmte Aufgaben, die von kl

arXiv – cs.AI 13.04.2026 04:00

Finde Modelle, Firmen und Themen

AlphaLab: Autonomes Forschungssystem mit LLMs revolutioniert Optimierung

Neues DACO-Framework stärkt Sicherheit multimodaler Sprachmodelle

Spatial‑Gym: Neue Benchmark für räumliches Denken in Robotik und Navigation

Neue Benchmark zeigt Schwächen von Open-Weight-LLMs beim mathematischen Denken

PRAGMA: Transformer-Modell für Finanzdaten

PilotBench: Benchmark für General Aviation Agenten mit Sicherheitsanforderungen

Stärkung der Unternehmensführung bei steigenden Edge‑AI‑Lasten

Neurale Modelle revolutionieren die Bewertung von Text‑zu‑Speech-Systemen

Temperaturabhängige Leistung von Prompting-Strategien in erweiterten LLMs

LLMs im Medizinbereich: Studie zeigt Lücke zwischen Prüfungs- und Praxisleistung

Automatisierte Metadaten-Standardisierung in der Biomedizin: LLM-Agent liefert präzise Ergebnisse

OpenKedge: Mutationskontrolle für autonome KI – Sicherheit durch Verträge

MiniMax präsentiert MMX-CLI: KI-CLI für Bild, Video, Sprache, Musik, Vision & Suche

CSAttention: Centroid-Scoring Attention beschleunigt LLM-Infere

Lehren im Zeitalter von ChatGPT: Ein Kampf gegen Entmoralisation

VerifAI: Open-Source-Engine für verifizierbare biomedizinische Antworten

SPPO: Neue Methode für effiziente Langzeit-Logik in Sprachmodellen

Von Geschäftsvorfällen zu prüfbaren Entscheidungen: Ontologie‑Graphsimulation für Unternehmens‑KI

Neue Methode misst Unsicherheit in Multi-Agenten-Systemen mit Tensorzerlegung

LLM-Textökosysteme: Drift und Auswahl formen die Zukunft des Lernens

E3-TIR: Effiziente Reasoning-Tools durch gezielte Erfahrungsausnutzung

LLM-gestützte Planung: Feedback-Optimierung verbessert Domänenqualität

Strategische algorithmische Monokultur: Experimentelle Beweise aus Koordinationsspielen

Neue Diffusionsmethode steigert Effizienz von modellbasiertem Reinforcement Learning

KI-Agenten revolutionieren dein Dating-Leben

Unternehmen erweitern KI-Einsatz, behalten dabei die Kontrolle

EXPONA: Automatisiertes Labeling mit vielfältiger, zuverlässiger Heuristik

Genomische Modelle kompakt: 200‑fach kleinere mRNA‑Lernmaschine

🍪 Cookie-Einstellungen