Suche nach Training | meineki.news

NVIDIA präsentiert Nemotron-Terminal – Datenpipeline für skalierbare LLM-Agenten

Der Wettlauf, autonome KI-Agenten zu entwickeln, steht vor einem großen Engpass: Daten. Während führende Modelle wie Claude Code und Codex…

MarkTechPost 10.03.2026 20:15

Aktuell

ABB: Physische KI‑Simulation steigert ROI in der Fabrikautomatisierung

ABB und NVIDIA haben eine neue Partnerschaft gestartet, die beweist, dass physische KI‑Simulation echte Renditen in der Fabrikautomatisieru…

AI News (TechForge) 10.03.2026 17:22

Forschung

Evo: Neues Modell vereint autoregressive und Diffusions-LLM für bessere Leistung

Die Forschung der letzten Woche hat ein neues Sprachmodell namens Evo vorgestellt, das die beiden bislang getrennten Ansätze der autoregres…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Apple ANE neu definiert: Orion ermöglicht effizientes LLM-Training und Inference

Zwei Milliarden Apple‑Geräte sind mit einem Neural Processing Unit (NPU) – dem Apple Neural Engine (ANE) – ausgestattet, doch bislang bleib…

arXiv – cs.LG 10.03.2026 04:00

Forschung

ATLAS: Kleine Modelle meistern große Toolsets mit gezieltem Reinforcement Learning

Ein neues Forschungsprojekt namens ATLAS hat die Grenzen kleiner Sprachmodelle (SLMs) in komplexen Tool‑Ökosystemen verschoben. Durch gezie…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Token‑Effizientes RL: NAT reduziert Rechenaufwand bei langen CoT‑Trails

Reinforcement Learning (RL) hat die Entwicklung großer Sprachmodelle maßgeblich vorangetrieben, doch die Skalierung von RL auf lange Chain‑…

arXiv – cs.LG 10.03.2026 04:00

Forschung

CapTrack: Vielseitige Analyse von Vergessensprozessen nach Post-Training von LLMs

Eine neue Studie auf arXiv beleuchtet, wie das Post-Training von großen Sprachmodellen (LLMs) nicht nur ihre Fähigkeiten verbessert, sonder…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Safe Transformer: Explizites Sicherheitsbit für interpretierbare KI

Eine neue Methode zur Sicherheit von Sprachmodellen, die auf dem arXiv-Preprint Safe Transformer basiert, setzt ein explizites Sicherheitsb…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Framework senkt Rechenaufwand für dezentrale Diffusionsmodelle um 16‑fach

Die Entwicklung von Diffusionsmodellen in der Größenordnung von Millionen von Parametern erfordert bislang enorme Rechenressourcen, die mei…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Erklärung des Attention‑Sinks: Warum LLMs den ersten Token dominieren

In großen Sprachmodellen kommt es häufig vor, dass ein einzelner Token unverhältnismäßig viel Aufmerksamkeit erhält – ein Phänomen, das als…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Dynamic Rejection Steering: LLMs folgen Anweisungen besser

Ein neues Verfahren namens DIRECTER (Dynamic Rejection Steering) hat die Fähigkeit großer Sprachmodelle (LLMs), komplexe Nutzeranweisungen…

arXiv – cs.LG 10.03.2026 04:00

Forschung

SWAN: Dynamische Aktivierungsnetzwerke für effiziente KI

Mit dem Aufkommen großer Sprach- und Bildmodelle stehen Entwickler vor einem Dilemma: die beeindruckende Leistungsfähigkeit dieser Systeme…

arXiv – cs.LG 10.03.2026 04:00

Produkt

NVIDIA und Thinking Machines Lab starten Gigawatt-Strategie für KI

NVIDIA und das Thinking Machines Lab haben heute eine mehrjährige strategische Partnerschaft bekannt gegeben, die darauf abzielt, mindesten…

NVIDIA – Blog 10.03.2026 13:00

Forschung

SR-Transformer nutzt FlashAttention dank Rank-Factorized Implicit Neural Bias

In den letzten Jahren haben sich Super‑Resolution‑Methoden zunehmend auf Transformer‑Architekturen verlassen, weil diese ein starkes Langze…

arXiv – cs.LG 10.03.2026 04:00

Forschung

LegoNet: Speicherbedarf von neuronalen Netzen um 64‑fach reduziert

Neural‑Network‑Entwickler haben mit LegoNet ein neues Verfahren zur drastischen Reduktion des Speicherverbrauchs vorgestellt. Dabei werden…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Neural Navigation in dichten Menschenmengen: Zero-Shot-Dichtegeneralisierung Eine neue Reinforcement‑Learning‑Methode ermöglicht es Robotern, sich sicher durch stark bevölkerte Räume zu bewegen, ohne dabei einzufrieren oder Kollisionen zu riskieren. Das System nutzt eine dichteinvariante Beobachtungscodierung, die die K‑nächsten Personen und kompakte Menschenmengen‑Zusammenfassungen enthält, sodass die Eingangsstatistiken unabhängig von der Gruppengröße stabil bleiben. Durch gezieltes Training mit 11 bis

arXiv – cs.LG 10.03.2026 04:00

Forschung

Verbesserte Einschränkungsgenerierung durch Verbindung vortrainierter Modelle

In einer neuen Veröffentlichung auf arXiv (2603.06742v1) wird ein innovatives Verfahren vorgestellt, das die Erzeugung von Daten unter komp…

arXiv – cs.LG 10.03.2026 04:00

Praxis

Andrej Karpathy stellt 'Autoresearch' vor: 630 Zeilen Python ML-Tests auf einer GPU

Andrej Karpathy hat ein neues, schlankes Python-Tool namens autoresearch veröffentlicht, das es KI-Agenten ermöglicht, eigenständig Machine…

MarkTechPost 09.03.2026 02:47

Praxis

Context Hub: Andrew Ng stellt Open‑Source‑Tool für aktuelle API‑Dokumentation vor

In der schnelllebigen Welt der agentenbasierten Arbeitsabläufe ist die Leistungsfähigkeit von KI-Modellen stark von der Qualität ihrer Doku…

MarkTechPost 09.03.2026 20:47

Forschung

SR‑TTT: Residual Test‑Time Training – Effiziente Kontextverarbeitung

Ein neues Verfahren namens SR‑TTT (Surprisal‑Aware Residual Test‑Time Training) wurde auf arXiv veröffentlicht (2603.06642v1). Es erweitert…

arXiv – cs.LG 10.03.2026 04:00

Forschung

KI-Modelle können ihre Gedankenketten kaum kontrollieren – neue Studie enthüllt

Eine neue Untersuchung aus dem arXiv-Repository (2603.05706v1) zeigt, dass moderne KI‑Modelle ihre „Chain‑of‑Thought“ (CoT) – also die Zwis…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Weak‑SIGReg: Kovarianz‑Regularisierung für stabile Deep‑Learning‑Modelle

Ein neues Verfahren namens Weak‑SIGReg sorgt dafür, dass tiefe neuronale Netze ohne auf architektonische Tricks angewiesen zu sein, stabil…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Grouter beschleunigt MoE-Training durch vorweggenommene Routenoptimierung

Traditionelles Mixture-of-Experts‑Training verknüpft gleichzeitig das Lernen der Expertengewichte mit der Suche nach einer optimalen Routin…

arXiv – cs.LG 10.03.2026 04:00

Forschung

<h1>Skalierung erhöht kritische semantische Duplikate im Pretraining</h1> <p>In der KI‑Forschung wird deutlich, dass Datenduplikate während des Pretrainings die Generalisierung von Modellen stark beeinträchtigen können. Besonders bei Web‑Skalen wird die Definition eines „Duplikats“ komplexer: Neben offensichtlichen Text‑Übereinstimmungen können semantisch gleichwertige Dokumente – etwa Übersetzungen – zu redundanten Trainingssignalen führen, sobald Modelle leistungsfähiger werden.</p> <p>Die Studie zeigt,

arXiv – cs.LG 10.03.2026 04:00

Forschung

RACAS: Agentensystem steuert diverse Roboter mit einer Sprachschnittstelle

Viele moderne Robotikplattformen stellen ihren Nutzern APIs zur Verfügung, über die externe Software die Aktuatoren steuern und Sensorwerte…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neues Tool ProtAlign verbessert Protein-Design durch Multi-Objective-Optimierung

Die Gestaltung von Proteinsequenzen erfordert ein feines Gleichgewicht zwischen Designfähigkeit – also der Fähigkeit, eine Zielstruktur exa…

arXiv – cs.LG 10.03.2026 04:00

Praxis

<h1>LLMs fördern nicht nur bekannte Technologien – neue Tools kommen durch</h1> <p>Ein häufiges Anliegen bei der Nutzung von Sprachmodellen für die Programmierung ist, dass sie die Wahl der Technologie zu denjenigen Werkzeugen verlagern, die am besten in den Trainingsdaten vertreten sind. Dadurch könnten neue, bessere Tools im Hintergrund bleiben. In den letzten Jahren zeigte sich das besonders bei Python oder JavaScript, die deutlich bessere Ergebnisse lieferten als weniger verbreitete Sprachen.</p> <p>Mit

Simon Willison – Blog 09.03.2026 13:37

Forschung

Bias‑Invariant Subnetworks: Fairness aus Standard‑Modellen extrahieren

Die zunehmende Besorgnis über algorithmische Vorurteile hat die Forschung zu einer Vielzahl von Debiasing‑Techniken geführt, die oft auf au…

arXiv – cs.LG 09.03.2026 04:00

Forschung

OMGD: Speicheroptimiertes Training mit verbesserter Konvergenz

Die KI-gestützte Analyse von Texten ist ein wichtiger Bestandteil der modernen Datenanalyse. Durch den Einsatz von KI-Algorithmen können Un…

arXiv – cs.LG 09.03.2026 04:00

Forschung

MIRACL: Meta‑Lern‑Framework für vielseitige Mehrziel‑Optimierung in Lieferketten

MIRACL, ein neues Meta‑Multi‑Objective‑Reinforcement‑Learning‑Framework, verspricht, die Herausforderungen der dynamischen Lieferkettenopti…

arXiv – cs.LG 09.03.2026 04:00

Finde Modelle, Firmen und Themen

NVIDIA präsentiert Nemotron-Terminal – Datenpipeline für skalierbare LLM-Agenten

ABB: Physische KI‑Simulation steigert ROI in der Fabrikautomatisierung

Evo: Neues Modell vereint autoregressive und Diffusions-LLM für bessere Leistung

Apple ANE neu definiert: Orion ermöglicht effizientes LLM-Training und Inference

ATLAS: Kleine Modelle meistern große Toolsets mit gezieltem Reinforcement Learning

Token‑Effizientes RL: NAT reduziert Rechenaufwand bei langen CoT‑Trails

CapTrack: Vielseitige Analyse von Vergessensprozessen nach Post-Training von LLMs

Safe Transformer: Explizites Sicherheitsbit für interpretierbare KI

Framework senkt Rechenaufwand für dezentrale Diffusionsmodelle um 16‑fach

Erklärung des Attention‑Sinks: Warum LLMs den ersten Token dominieren

Dynamic Rejection Steering: LLMs folgen Anweisungen besser

SWAN: Dynamische Aktivierungsnetzwerke für effiziente KI

NVIDIA und Thinking Machines Lab starten Gigawatt-Strategie für KI

SR-Transformer nutzt FlashAttention dank Rank-Factorized Implicit Neural Bias

LegoNet: Speicherbedarf von neuronalen Netzen um 64‑fach reduziert

Verbesserte Einschränkungsgenerierung durch Verbindung vortrainierter Modelle

Andrej Karpathy stellt 'Autoresearch' vor: 630 Zeilen Python ML-Tests auf einer GPU

Context Hub: Andrew Ng stellt Open‑Source‑Tool für aktuelle API‑Dokumentation vor

SR‑TTT: Residual Test‑Time Training – Effiziente Kontextverarbeitung

KI-Modelle können ihre Gedankenketten kaum kontrollieren – neue Studie enthüllt

Weak‑SIGReg: Kovarianz‑Regularisierung für stabile Deep‑Learning‑Modelle

Grouter beschleunigt MoE-Training durch vorweggenommene Routenoptimierung

RACAS: Agentensystem steuert diverse Roboter mit einer Sprachschnittstelle

Neues Tool ProtAlign verbessert Protein-Design durch Multi-Objective-Optimierung

Bias‑Invariant Subnetworks: Fairness aus Standard‑Modellen extrahieren

OMGD: Speicheroptimiertes Training mit verbesserter Konvergenz

MIRACL: Meta‑Lern‑Framework für vielseitige Mehrziel‑Optimierung in Lieferketten

🍪 Cookie-Einstellungen