Suche nach Begründungen

DeepFact: Dynamische Benchmarks & Agenten für Faktenprüfung in Forschung

DeepFact, die neue Initiative von Forschern, kombiniert dynamische Benchmarks mit leistungsstarken Agenten, um die Faktenprüfung in tiefgre…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neues Framework GUIDE verbessert automatisierte Bewertung von offenen Antworten

Die automatisierte Bewertung von offenen Schülerantworten ist ein entscheidender Schritt, um personalisiertes Feedback in großem Umfang zu…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Solver-basierte Zertifikate erklären Satellitenplanung präzise

Satellitenbetreiber, die Erdbeobachtungssatelliten steuern, benötigen klare Begründungen für ihre Planungsentscheidungen: Warum wurde ein A…

arXiv – cs.AI 03.03.2026 05:00

Aktuell

Vertrauen in agentische KI für Finanzprozesse: Vertrauen stärken

Vertrauen in agentische KI für Finanzprozesse ist heute ein zentrales Anliegen der Technologieleiter. In den letzten zwei Jahren haben Unte…

AI News (TechForge) 27.02.2026 13:15

Forschung

Neuer Ansatz: Alignment-Weighted DPO stärkt Sicherheit von Sprachmodellen

In den letzten Jahren haben Techniken wie Supervised Fine‑Tuning (SFT), Reinforcement Learning from Human Feedback (RLHF) und Direct Prefer…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Proto-Caps: Genauigkeit und Erklärbarkeit bei Lungenkrebs-Scans erhöhen

Eine neue Methode namens Proto‑Caps, die auf Capsule‑Netzwerken, Prototyp‑Lernen und privilegierten Informationen basiert, hat bei der Klas…

arXiv – cs.AI 25.02.2026 05:00

Forschung

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> <p>Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht.</p> <p>In der neuen Studie wird

arXiv – cs.AI 23.02.2026 05:00

Forschung

Differential Reasoning Learning schließt Logiklücken klinischer Agenten

Eine neue Methode namens Differential Reasoning Learning (DRL) verspricht, die Zuverlässigkeit von KI‑gestützten klinischen Entscheidungsun…

arXiv – cs.AI 11.02.2026 05:00

Forschung

KI-Modell kombiniert Kollaboratives Filtern mit Sprachmodellen für Empfehlungen

Eine neue Veröffentlichung auf arXiv (2602.05544v1) stellt RGCF‑XRec vor – ein hybrides Framework, das die Stärken von kollaborativem Filte…

arXiv – cs.AI 06.02.2026 05:00

Forschung

<p>Neues Paradigma für Moderation: Von sparsamen zu dichten Begründungen</p> <p>Die Sicherheit von Inhalten ist heute wichtiger denn je. Während textbasierte Moderationssysteme bereits hohe Erfolgsraten erzielen, bleiben multimodale Varianten – die Bild-, Video- und Audiodaten berücksichtigen – stark behindert durch Daten- und Supervisionssparsity. Klassische Ansätze, die ausschließlich auf binären Labels beruhen, führen häufig zu „Shortcut‑Learning“, bei dem Modelle oberflächliche Merkmale nutzen und die e

arXiv – cs.LG 04.02.2026 05:00

Forschung

HEART: Benchmark vergleicht Menschen und KI in emotionaler Unterstützung

Ein neues Forschungswerk aus dem Bereich der künstlichen Intelligenz stellt einen Meilenstein dar: Das HEART-Framework (Human-Emotion-Align…

arXiv – cs.AI 29.01.2026 05:00

Forschung

Intuition zu Expertise: Rubrikbasierte Kalibrierung zur Erkennung LLM-Koreanisch

Die Unterscheidung von menschlich verfasstem Koreanisch und von großen Sprachmodellen (LLM) erzeugtem Text bleibt auch für sprachlich gesch…

arXiv – cs.AI 29.01.2026 05:00

Forschung

KI-gestützte Reflexionsfragen: Zwei-Agenten-Framework verbessert Qualität

Eine neue Studie zeigt, wie KI-basierte Sprachmodelle Lehrkräfte bei der Erstellung von Reflexionsfragen unterstützen können. Durch einen s…

arXiv – cs.LG 22.01.2026 05:00

Forschung

VisTIRA schließt Bild-Text-Lücke in visueller Mathematik

Vision‑Language‑Modelle (VLMs) schneiden bei mathematischem Denken schlechter ab als reine Text‑Modelle, wenn dieselben Aufgaben als Bilder…

arXiv – cs.AI 22.01.2026 05:00

Forschung

AdaMARP: Adaptives Multi-Agent-Framework für immersives Rollenspiel

Die Nutzung von großen Sprachmodellen (LLMs) für Rollenspiele soll es ermöglichen, beliebige Charaktere in interaktiven Erzählungen darzust…

arXiv – cs.AI 19.01.2026 05:00

Forschung

MMRAG-RFT: Zweistufiges Reinforcement Learning für erklärbare Retrieval-Generierung

Ein neues Verfahren namens MMRAG-RFT kombiniert multimodale Retrieval-gestützte Generierung mit Reinforcement Learning, um die Erklärbarkei…

arXiv – cs.AI 22.12.2025 05:00

Forschung

LLM-Chatbot liefert 90 % Genauigkeit bei Frühdiagnose – interaktiv

Gesundheitssysteme weltweit kämpfen mit ineffizienten Diagnosen, steigenden Kosten und eingeschränktem Zugang zu Fachärzten. Diese Probleme…

arXiv – cs.AI 22.12.2025 05:00

Forschung

Zwei-Stufen-Ansatz erkennt Gesundheits‑Desinformation dank KI‑Debatte

In einer Zeit, in der Gesundheits‑Falschmeldungen immer häufiger online auftauchen, wird die Überprüfung von Behauptungen zu einer entschei…

arXiv – cs.AI 12.12.2025 05:00

Forschung

Vertrauenswürdige Rechts-IA: L4M kombiniert LLM-Agenten mit formaler Logik

In einer wegweisenden Studie wird ein neues Framework namens L4M vorgestellt, das die Zuverlässigkeit von KI im juristischen Bereich deutli…

arXiv – cs.AI 27.11.2025 05:00

Forschung

LLM-gestützte Hierarchie-Neuordnung senkt Verzerrung hyperbolischer Einbettungen

In einer wegweisenden Studie zeigen die Autoren, dass Large Language Models (LLMs) in der Lage sind, hierarchische Wissensstrukturen so neu…

arXiv – cs.AI 27.11.2025 05:00

Forschung

Multimodale Chain-of-Thought: Analyse zeigt Grenzen der Domänenübergreifenden

Die jüngsten Fortschritte bei multimodalen Chain-of-Thought (CoT)-Modellen haben vor allem in wissenschaftlichen Frage‑Antwort‑Benchmarks w…

arXiv – cs.AI 27.11.2025 05:00

Forschung

VRSLU: Benchmark mit visuellen Szenen und Begründungen für Sprachverstehen

Spoken Language Understanding (SLU) umfasst die Aufgaben Intent Detection und Slot Filling. Für den Einsatz in der Praxis ist es entscheide…

arXiv – cs.AI 25.11.2025 05:00

Forschung

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…

arXiv – cs.AI 20.11.2025 05:00

Forschung

<h1>Ask WhAI: System zur Analyse von Glaubensbildung bei rollenbasierten LLM-Agenten</h1> <p>Mit Ask WhAI eröffnet ein neues Framework die Möglichkeit, die inneren Glaubensstrukturen von Sprachmodellen in komplexen Interaktionsszenarien zu untersuchen und gezielt zu verändern. Das System zeichnet sämtliche Agenteninteraktionen auf, ermöglicht deren Wiedergabe und erlaubt über den normalen Kommunikationskanal hinaus gezielte Abfragen zu den Überzeugungen und Begründungen jedes einzelnen Agenten.</p> <p>Ein b

arXiv – cs.AI 20.11.2025 05:00

Forschung

RECAP-PATH: KI-Framework liefert nachvollziehbare Diagnosen in der Pathologie

KI‑Tools haben die Pathologie bereits revolutioniert: Sie steigern die Durchsatzrate, standardisieren die Quantifizierung und entdecken pro…

arXiv – cs.AI 18.11.2025 05:00

Forschung

EcoAlign: Wirtschaftlich effiziente Ausrichtung großer Vision‑Language‑Modelle

Ein neues Konzept namens EcoAlign verspricht, die Sicherheit und Nützlichkeit großer Vision‑Language‑Modelle (LVLMs) zu verbessern, ohne da…

arXiv – cs.AI 17.11.2025 05:00

Forschung

Neuer Bayesian-Optimierer löst parametrisierte Mehrzielprobleme ohne teure Tests

Viele praxisnahe Anwendungen erfordern die Lösung von Familien teurer Mehrzieloptimierungsaufgaben (EMOPs) unter wechselnden Betriebsbeding…

arXiv – cs.LG 14.11.2025 05:00

Forschung

Maestro: Mehrere LLMs kooperieren effizienter – neue Methode für Multi-Agenten

In der Welt der künstlichen Intelligenz gewinnen Multi-Agenten-Systeme, die auf großen Sprachmodellen (LLMs) basieren, zunehmend an Bedeutu…

arXiv – cs.AI 11.11.2025 05:00

Forschung

ORCHID: KI-gestützte Klassifizierung von Hochrisikogut mit Kontrolle

Das neue System ORCHID bietet eine innovative Lösung für die Klassifizierung von Hochrisikogut (HRP) an Standorten des US‑Department of Ene…

arXiv – cs.AI 10.11.2025 05:00

Forschung

Neue Methode TORSO nutzt interne Logik von LLMs ohne Beispiele

Forscher haben eine neue Technik namens Template‑Oriented Reasoning (TORSO) vorgestellt, die große Sprachmodelle (LLMs) dazu bringt, ihre e…

arXiv – cs.AI 12.09.2025 05:00

Finde Modelle, Firmen und Themen

DeepFact: Dynamische Benchmarks & Agenten für Faktenprüfung in Forschung

Neues Framework GUIDE verbessert automatisierte Bewertung von offenen Antworten

Solver-basierte Zertifikate erklären Satellitenplanung präzise

Vertrauen in agentische KI für Finanzprozesse: Vertrauen stärken

Neuer Ansatz: Alignment-Weighted DPO stärkt Sicherheit von Sprachmodellen

Proto-Caps: Genauigkeit und Erklärbarkeit bei Lungenkrebs-Scans erhöhen

Differential Reasoning Learning schließt Logiklücken klinischer Agenten

KI-Modell kombiniert Kollaboratives Filtern mit Sprachmodellen für Empfehlungen

HEART: Benchmark vergleicht Menschen und KI in emotionaler Unterstützung

Intuition zu Expertise: Rubrikbasierte Kalibrierung zur Erkennung LLM-Koreanisch

KI-gestützte Reflexionsfragen: Zwei-Agenten-Framework verbessert Qualität

VisTIRA schließt Bild-Text-Lücke in visueller Mathematik

AdaMARP: Adaptives Multi-Agent-Framework für immersives Rollenspiel

MMRAG-RFT: Zweistufiges Reinforcement Learning für erklärbare Retrieval-Generierung

LLM-Chatbot liefert 90 % Genauigkeit bei Frühdiagnose – interaktiv

Zwei-Stufen-Ansatz erkennt Gesundheits‑Desinformation dank KI‑Debatte

Vertrauenswürdige Rechts-IA: L4M kombiniert LLM-Agenten mit formaler Logik

LLM-gestützte Hierarchie-Neuordnung senkt Verzerrung hyperbolischer Einbettungen

Multimodale Chain-of-Thought: Analyse zeigt Grenzen der Domänenübergreifenden

VRSLU: Benchmark mit visuellen Szenen und Begründungen für Sprachverstehen

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

RECAP-PATH: KI-Framework liefert nachvollziehbare Diagnosen in der Pathologie

EcoAlign: Wirtschaftlich effiziente Ausrichtung großer Vision‑Language‑Modelle

Neuer Bayesian-Optimierer löst parametrisierte Mehrzielprobleme ohne teure Tests

Maestro: Mehrere LLMs kooperieren effizienter – neue Methode für Multi-Agenten

ORCHID: KI-gestützte Klassifizierung von Hochrisikogut mit Kontrolle

Neue Methode TORSO nutzt interne Logik von LLMs ohne Beispiele

🍪 Cookie-Einstellungen

LLM-Chatbot liefert 90 % Genauigkeit bei Frühdiagnose – interaktiv