KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Einbettung”

Cross‑Fitted Proximal Learning verbessert Modellbasiertes Reinforcement Learning

Modellbasiertes Reinforcement Learning (RL) gilt als besonders vielversprechend, weil es explizit Belohnungs‑ und Übergangsmuster erfasst u…

arXiv – cs.LG 08.04.2026 04:00

IntentScore: KI-basiertes Bewertungssystem steigert Erfolg von Agents

Computer‑Use Agents (CUAs) nutzen große Sprachmodelle, um grafische Benutzeroberflächen zu steuern. Dabei fehlt ihnen bislang ein Mechanism…

arXiv – cs.AI 08.04.2026 04:00

Mehragenten-LLM-Komitees: Kollaps messen & diversitätsorientierter Konsens

In einer neuen Studie untersuchen Forscher, wie Multi‑Agenten‑LLM‑Komitees – also mehrere Instanzen desselben Modells, die unter unterschie…

arXiv – cs.LG 07.04.2026 04:00

OntoTKGE: Ontologie-gestützte Vorhersage von zukünftigen Fakten in Zeit-KG

Ein brandneues Modell namens OntoTKGE nutzt Ontologien, um die Vorhersage von zukünftigen Fakten in zeitlich strukturierten Wissensgraphen…

arXiv – cs.AI 08.04.2026 04:00

Spektral-Framework verbindet globale und lokale Strukturen in nichtlinearen DR

Ein neues Spektral-Framework für nichtlineare Dimensionsreduktion (DR) löst seit langem bestehende Konflikte zwischen globaler und lokaler…

arXiv – cs.LG 06.04.2026 04:00

Testzeit-Computing steigert latente Generalisierung von Sprachmodellen Sprachmodelle nutzen zwei Wege, um Wissen zu speichern: das Einbetten von Informationen in die Modellgewichte (Gewichtseinbettung) und das Lernen aus Kontext (Kontextlernen). Während letzteres besonders stark in der latenten Generalisierung ist, fällt das erste Verfahren häufig bei deduktiven Aufgaben. Dieses Defizit wird als „latente Generalisierung“ bezeichnet und führt zu Problemen wie dem Umkehrfluch. Frühere Ansätze versuchten,

arXiv – cs.LG 03.04.2026 04:00

MOON3.0: KI-Modell für feinkörnige Produktanalyse im E‑Commerce

Mit dem rasanten Wachstum des Online-Handels gewinnt die Entwicklung von allgemeinen, nicht auf einzelne Aufgaben zugeschnittenen Repräsent…

arXiv – cs.LG 02.04.2026 04:00

Neues ML-Modell simuliert Wellenreflexion an heterogenen Medien

Ein innovatives maschinelles Lernmodell wurde entwickelt, um die Lösungen der Maxwell‑Gleichungen in einer Dimension zu approximieren. Der…

arXiv – cs.LG 02.04.2026 04:00

Mehr Tokens, weniger Engpässe: GNNs & LLMs revolutionieren GraphQA

Die Kombination von Graph Neural Networks (GNNs) mit Large Language Models (LLMs) eröffnet neue Möglichkeiten für Graph Question Answering…

arXiv – cs.LG 02.04.2026 04:00

Rashomon-Effekt: Mehrere optimale Visualisierungen für hochdimensionale Daten

Die Reduktion von hochdimensionalen Daten ist von Natur aus mehrdeutig: Verschiedene Einbettungen können die Struktur gleichermaßen gut erh…

arXiv – cs.LG 02.04.2026 04:00

ReTriP: Verstärkte Logik für end-to-end retrosynthetische Planung

In der organischen Chemie ist die retrosynthetische Planung ein zentrales Problem, das durch die enorme Kombinatorik schwer zu lösen ist. F…

arXiv – cs.AI 01.04.2026 04:00

Neues DSL für LLM-Routing: Von Inference zu Agenten-Workflow mit geprüfter Policy

Ein neues, nicht Turing-vollständiges Policy‑Language‑DSL namens Semantic Router wird bereits in der Produktion eingesetzt, um Anfragen an…

arXiv – cs.LG 31.03.2026 04:00

PiCSRL: Physikbasierte Verstärkungslernen optimiert adaptive Sensortechniken

In einer Zeit, in der hochdimensionale, aber stark unterrepräsentierte Datensätze die Entwicklung zuverlässiger Umweltmodelle erschweren, p…

arXiv – cs.LG 31.03.2026 04:00

Neues Framework: Hierarchische Sheaf‑Spektrale Einbettung für Single‑Cell RNA‑seq

Die Analyse von Single‑Cell‑RNA‑seq‑Daten erfordert Repräsentationen, die heterogene lokale Strukturen über mehrere Skalen hinweg erfassen…

arXiv – cs.LG 31.03.2026 04:00

Semantische Interaktionsinformation verbessert Zusammensetzungsgeneralisation

Wissenschaftler haben eine neue Methode entwickelt, um die Grenzen der Generalisierung in komplexen Lernsystemen zu überwinden. Dabei wird…

arXiv – cs.LG 31.03.2026 04:00

GSR-GNN: Training beschleunigen & Speicher sparen tiefen GNNs Schaltkreisen

Die neue Methode GSR‑GNN verspricht, das Training tiefer Graph Neural Networks (GNNs) für Schaltkreisanalysen massiv zu beschleunigen und g…

arXiv – cs.LG 31.03.2026 04:00

Deep Energy Method mit Parameterisierung für zufällige Materialeigenschaften

In der Praxis von Bauwerksdesign und Festkörpermechanik variieren Materialeigenschaften stets innerhalb bestimmter Grenzen. Diese Zufälligk…

arXiv – cs.LG 30.03.2026 04:00

DeepDemand: Theorie‑informiertes Deep Learning für langfristige Verkehrsprognosen

Die Planung von Verkehrsinfrastrukturen erfordert zuverlässige Prognosen über mehrere Jahre. Traditionelle Nachfrage‑Modelle liefern zwar e…

arXiv – cs.LG 30.03.2026 04:00

AutoSAM: KI-gestützte Automatisierung von SAM-Input-Dateien

In der Planung und Sicherheitsanalyse moderner Reaktoren bleibt das Erstellen von Input‑Dateien für das System Analysis Module (SAM) ein au…

arXiv – cs.AI 27.03.2026 04:00

Physik-informiertes Netzwerk für Destillationskolonnen liefert präzise Vorhersagen

Ein neuer Digital‑Twin‑Ansatz kombiniert physikbasierte maschinelle Lernverfahren mit Simulationsergebnissen aus Aspen HYSYS und eröffnet d…

arXiv – cs.LG 27.03.2026 04:00

Neue Methode entdeckt: Lichtkegel ermöglichen visuelle Hierarchien

Standard‑Vision‑Modelle behandeln Objekte als unabhängige Punkte im euklidischen Raum und können damit die hierarchische Struktur von Teile…

arXiv – cs.LG 27.03.2026 04:00

MSA: Memory Sparse Attention skaliert LLMs auf 100 M Tokens

Die neueste Veröffentlichung von MSA – Memory Sparse Attention – eröffnet einen Weg, die Langzeit‑Speicherfähigkeit von Sprachmodellen mass…

arXiv – cs.AI 26.03.2026 04:00

Neues Diffusionsmodell generiert EHRs in Echtzeit – 50 Schritte statt 1.000

Ein neues kontinuierliches Diffusionsframework verspricht, die Synthese von elektronischen Gesundheitsakten (EHRs) zu revolutionieren. Währ…

arXiv – cs.LG 26.03.2026 04:00

Neuer, trainingsfreier Halluzinationsdetektor für große Sprachmodelle

Halluzinationen in großen Sprachmodellen bleiben ein zentrales Hindernis für deren vertrauenswürdige Nutzung. Um dieses Problem anzugehen…

arXiv – cs.LG 25.03.2026 04:00

Neue Technik beschleunigt Diffusionsmodelle: Drei Schritte reichen

Diffusionsmodelle erzeugen Bilder von höchster Qualität, doch die Inferenz bleibt wegen der vielen sequentiellen Netzwerkaufrufe langsam. B…

arXiv – cs.LG 25.03.2026 04:00

SAiW: Proaktive Wasserzeichen zur Verhinderung von Deepfakes

Deepfakes, die von modernen generativen Modellen erzeugt werden, stellen eine ernsthafte Bedrohung für die Informationsintegrität, digitale…

arXiv – cs.AI 25.03.2026 04:00

MIOFlow 2.0: Zelltrajektorien-Framework für Einzelzell- und Spatial-Transkriptomik

Die neue Version von MIOFlow (Manifold Interpolating Optimal-Transport Flow) bietet ein einheitliches Modell, um Zelltrajektorien aus Einze…

arXiv – cs.LG 25.03.2026 04:00

Neues Verfahren: FalconBC optimiert Patienten‑spezifische Herz‑Kreislauf‑Modelle

Die präzise Abstimmung von Randbedingungen ist ein entscheidender Schritt bei der Erstellung patientenspezifischer Herz‑Kreislauf‑Modelle…

arXiv – cs.LG 23.03.2026 04:00

Vermeidung von Konflikten in probabilistischen ML‑Routing‑Policies

In der Welt der Netzwerk‑ und Zugriffs‑Policies gilt die Konflikterkennung seit langem als gelöst – solange jede Regelbedingung ein klar de…

arXiv – cs.LG 20.03.2026 04:00

Neue Forschung: Fakten als First-Class-Objekte verbessern LLM-Erinnerung

In einer aktuellen Studie von arXiv wird gezeigt, dass große Sprachmodelle (LLMs) zunehmend als dauerhafte Wissensarbeiter eingesetzt werde…

arXiv – cs.AI 19.03.2026 04:00