KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Lehrermodell”

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> <p>Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht.</p> <p>In der neuen Studie wird

arXiv – cs.AI 23.02.2026 05:00

B‑DENSE: Mehrschichtige Trajektorienausrichtung verbessert Diffusionsmodelle

Diffusionsmodelle haben die Bildgenerierung revolutioniert, doch ihre sequentielle Sampling‑Logik führt zu hohen Latenzen. Durch die wieder…

arXiv – cs.LG 19.02.2026 05:00

NVIDIA präsentiert C‑RADIOv4: Vision-Backbone vereint SigLIP2, DINOv3 und SAM3

NVIDIA hat mit C‑RADIOv4 einen neuen Vision‑Backbone vorgestellt, der die Stärken von SigLIP2, DINOv3 und SAM3 in einem einzigen Modell ver…

MarkTechPost 07.02.2026 00:31

Kompakte Modelle übertreffen große Lehrer: DLNet für Batteriezustandsprognosen

In modernen Batteriemanagementsystemen wird immer mehr Wert auf präzise Gesundheitsprognosen gelegt, die gleichzeitig auf Geräten mit begre…

arXiv – cs.LG 13.01.2026 05:00

Neues Paradigma: Datenlose Wissensübertragung zwischen KI-Modellen

Moderne KI-Systeme sind stark auf riesige Datensätze angewiesen, um Modelle zu trainieren und Wissen zwischen ihnen zu übertragen. Traditio…

arXiv – cs.LG 25.11.2025 05:00

Ein kompakter Multi-Task-MoE-Ansatz für effizientes automatisiertes Scoring

Automatisches Bewerten von schriftlichen Antworten wird üblicherweise mit einem separaten Modell pro Aufgabe realisiert. Das führt zu hohem…

arXiv – cs.LG 25.11.2025 05:00

Kalibrierung des Lehrermodells steigert die Leistung bei Knowledge Distillation

In der aktuellen Forschung zur Modellkompression hat sich Knowledge Distillation (KD) als äußerst wirkungsvolle Methode etabliert. Dabei üb…

arXiv – cs.AI 29.08.2025 05:00