Suche nach Skalierung | meineki.news

Token‑Effizientes RL: NAT reduziert Rechenaufwand bei langen CoT‑Trails

Reinforcement Learning (RL) hat die Entwicklung großer Sprachmodelle maßgeblich vorangetrieben, doch die Skalierung von RL auf lange Chain‑…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Mehr Stimmen bedeuten nicht mehr Wahrheit: Warum Konsens bei LLMs versagt

Forscher haben untersucht, ob die Erhöhung der Inferenzkosten durch das Sammeln vieler Antworten die Wahrhaftigkeit großer Sprachmodelle in…

arXiv – cs.LG 10.03.2026 04:00

Forschung

Dynamic Rejection Steering: LLMs folgen Anweisungen besser

Ein neues Verfahren namens DIRECTER (Dynamic Rejection Steering) hat die Fähigkeit großer Sprachmodelle (LLMs), komplexe Nutzeranweisungen…

arXiv – cs.LG 10.03.2026 04:00

Forschung

SR-Transformer nutzt FlashAttention dank Rank-Factorized Implicit Neural Bias

In den letzten Jahren haben sich Super‑Resolution‑Methoden zunehmend auf Transformer‑Architekturen verlassen, weil diese ein starkes Langze…

arXiv – cs.LG 10.03.2026 04:00

Forschung

<h1>Skalierung erhöht kritische semantische Duplikate im Pretraining</h1> <p>In der KI‑Forschung wird deutlich, dass Datenduplikate während des Pretrainings die Generalisierung von Modellen stark beeinträchtigen können. Besonders bei Web‑Skalen wird die Definition eines „Duplikats“ komplexer: Neben offensichtlichen Text‑Übereinstimmungen können semantisch gleichwertige Dokumente – etwa Übersetzungen – zu redundanten Trainingssignalen führen, sobald Modelle leistungsfähiger werden.</p> <p>Die Studie zeigt,

arXiv – cs.LG 10.03.2026 04:00

Forschung

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

Die Gewinnung von Erkenntnissen aus elektronischen Gesundheitsakten (EHR) erfordert häufig SQL-Kenntnisse, was die Entscheidungsfindung im…

arXiv – cs.AI 09.03.2026 04:00

Forschung

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

VDCook ist ein selbstentwickelndes Video‑Datenbetriebssystem, das Forschern und Fachteams eine vollständig konfigurierbare Plattform bietet…

arXiv – cs.AI 09.03.2026 04:00

Forschung

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

Autonome Coding‑Agenten können in kurzer Zeit starke Baselines für tabellarische Aufgaben erzeugen – ähnlich wie bei Kaggle‑Wettbewerben. D…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Starke Modelle lernen von schwachen Lehrern: Neue Skalierungsgesetze

In der modernen KI‑Forschung ist es üblich, ein bereits trainiertes Modell zu nutzen, um Daten zu kennzeichnen, und diese gekennzeichneten…

arXiv – cs.LG 09.03.2026 04:00

Forschung

MoE-Linsen: Ein Experte reicht aus

Mixture-of-Experts‑Modelle (MoE) ermöglichen eine parameter‑effiziente Skalierung, indem sie nur wenige Experten pro Berechnung aktivieren…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

Plateaus – Phasen, in denen ein Agent bei PPO nicht mehr Fortschritte macht – sind ein häufiges Problem in der on‑policy‑Reinforcement‑Lear…

arXiv – cs.LG 09.03.2026 04:00

Forschung

PDE-Foundation-Model beschleunigt Parameterbestimmung in ICF

In der Forschung zu Inertial Confinement Fusion (ICF) setzen Wissenschaftler zunehmend auf sogenannte PDE‑Foundation‑Modelle. Diese Modelle…

arXiv – cs.LG 06.03.2026 05:00

Aktuell

Intelligente Automatisierung skalieren – ohne Live‑Workflows zu brechen

Die Skalierung intelligenter Automatisierung erfordert einen Fokus auf architektonische Elastizität, nicht nur die Bereitstellung weiterer…

AI News (TechForge) 06.03.2026 13:15

Forschung

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

Large Language Models (LLMs) zeigen großes Potenzial im medizinischen Frage‑Antwort‑Bereich, doch ihre Neigung zu Halluzinationen und veral…

arXiv – cs.AI 05.03.2026 05:00

Aktuell

KI skalieren erfordert vertrauenswürdige Daten – CDOs setzen auf Qualitätslösungen

Eine aktuelle Befragung von Chief Data Officers zeigt, dass die Hälfte der Unternehmen, die agentische KI einsetzen, Datenqualitäts- und Ab…

ZDNet – Artificial Intelligence 06.03.2026 02:00

Forschung

Olmo Hybrid: Neuer Durchbruch in Open‑Source‑LLM‑Architekturen

Das neueste Olmo-Modell setzt neue Maßstäbe für die Entwicklung großer Sprachmodelle. Durch die Kombination einer Hybrid‑Architektur mit fo…

Interconnects – Nathan Lambert 05.03.2026 16:16

Forschung

Probabilistisches Träumen verbessert Weltenmodelle um 4,5 %

Mit großer Begeisterung stellen die Forscher eine neue Variante des Dreamer-Modells vor, die probabilistische Techniken nutzt, um das Lerne…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Mathematische Modelle: Erfolgreich, aber instabil – Das Tiefe‑Genauigkeit-Paradox

Mathematische Rechenmodelle werden heute in Bildung, automatisierten Tutorien und Entscheidungsunterstützungssystemen eingesetzt, obwohl si…

arXiv – cs.LG 05.03.2026 05:00

Forschung

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

Die Vorhersage chemischer Reaktionen ist ein entscheidender Schritt, um die Entwicklung neuer Medikamente und die Planung von Synthesen zu…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Neues Framework für Reward Modeling: Ordinale Likert-Skala als Grundlage

In der Welt der großen Sprachmodelle ist das Reward‑Modeling entscheidend, um die Systeme an menschliche Vorlieben anzupassen. Bisher fehlt…

arXiv – cs.LG 04.03.2026 05:00

Forschung

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reinforcement‑Learning‑Modelle, die auf Group Relative Policy Optimization (GRPO) setzen, haben sich als effektive Methode etabliert, um di…

arXiv – cs.AI 03.03.2026 05:00

Forschung

<h1>Label-basierte Distanzskalierung verbessert Few-Shot-Textklassifikation</h1> <p>In der Welt der Few-Shot-Textklassifikation, bei der Modelle unbekannte Klassen mit nur wenigen gelabelten Textproben erkennen sollen, gibt es ein zentrales Problem: Während des Trainings werden komplexe Algorithmen entwickelt, doch die gelabelten Stichproben, die im Test verwendet werden, werden zufällig ausgewählt. Dadurch erhalten die Modelle oft keine wirklichen Leitfäden, was zu Fehlklassifikationen führt.</p> <p>Die ne

arXiv – cs.LG 04.03.2026 05:00

Forschung

Reward-Modelle ohne menschliche Hilfe: Skalierung durch unüberwachtes Lernen

Forscher haben einen neuen Ansatz vorgestellt, mit dem Belohnungsmodelle ohne menschliche Annotationen skaliert werden können. Durch das Tr…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Full-Waveform-Inversion (FWI) ist ein hochkomplexes, nichtlineares Problem, das versucht, Untergrundgeschwindigkeitskarten aus an der Oberfläche aufgezeichneten seismischen Wellen zu rekonstruieren. Traditionell wurden datengetriebene FWI-Methoden mit kleinen Modellen trainiert, weil verfügbare Datensätze begrenzte Volumen, geologische Vielfalt und räumliche Ausdehnung aufweisen. Diese Beschränkungen führten zu erheblichen Bedenken hinsichtlich Overfitting und einer schlechten Generalisierung auf realistisc

In der vorliegenden Studie wird gezeigt, dass ein Modell, das ausschließlich auf simulierten und relativ einfachen Daten trainiert wurde, e…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Neues Schlaf-Foundation-Modell OSF setzt Maßstäbe in Präzision und Skalierbarkeit

Polysomnographie (PSG) gilt als Goldstandard zur Schlafbewertung, leidet jedoch unter großer Heterogenität der Messgeräte und Probandengrup…

arXiv – cs.LG 03.03.2026 05:00

Forschung

ODAR: Prinzipielle adaptive Routenplanung für LLM-Logik mittels aktiver Inferenz

Die Art und Weise, wie große Sprachmodelle (LLMs) logische Aufgaben lösen, hat sich grundlegend gewandelt: Statt die Modellparameter weiter…

arXiv – cs.AI 02.03.2026 05:00

Forschung

Neues Training für MoE-Modelle: Experten lernen sich zu spezialisieren

Die Mixture-of-Experts (MoE)-Architektur gilt als Schlüsseltechnologie für die Skalierung großer Sprachmodelle, leidet jedoch häufig unter…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Tiefe Decoder steigern Routing-Modelle: Neue Skalierungsstrategie

Ein neuer Beitrag auf arXiv untersucht, wie neuronale Routing‑Solver – die aus einem Encoder und einem Decoder bestehen – effizienter skali…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Solver-basierte Zertifikate erklären Satellitenplanung präzise

Satellitenbetreiber, die Erdbeobachtungssatelliten steuern, benötigen klare Begründungen für ihre Planungsentscheidungen: Warum wurde ein A…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Neues multimodales Retrieval: TTE‑v2 setzt Token‑Skalierung ein

Traditionelle multimodale Retrieval-Systeme setzen vorwiegend auf Bi‑Encoder-Architekturen, bei denen die Leistung stark von der Embedding‑…

arXiv – cs.AI 02.03.2026 05:00

Finde Modelle, Firmen und Themen

Token‑Effizientes RL: NAT reduziert Rechenaufwand bei langen CoT‑Trails

Mehr Stimmen bedeuten nicht mehr Wahrheit: Warum Konsens bei LLMs versagt

Dynamic Rejection Steering: LLMs folgen Anweisungen besser

SR-Transformer nutzt FlashAttention dank Rank-Factorized Implicit Neural Bias

Case-Based Reasoning steigert SQL-Genauigkeit bei EHR-Daten

VDCook: Selbstlernende Video‑Datenplattform revolutioniert ML‑Datensätze

TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten

Starke Modelle lernen von schwachen Lehrern: Neue Skalierungsgesetze

MoE-Linsen: Ein Experte reicht aus

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

PDE-Foundation-Model beschleunigt Parameterbestimmung in ICF

Intelligente Automatisierung skalieren – ohne Live‑Workflows zu brechen

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

KI skalieren erfordert vertrauenswürdige Daten – CDOs setzen auf Qualitätslösungen

Olmo Hybrid: Neuer Durchbruch in Open‑Source‑LLM‑Architekturen

Probabilistisches Träumen verbessert Weltenmodelle um 4,5 %

Mathematische Modelle: Erfolgreich, aber instabil – Das Tiefe‑Genauigkeit-Paradox

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

Neues Framework für Reward Modeling: Ordinale Likert-Skala als Grundlage

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reward-Modelle ohne menschliche Hilfe: Skalierung durch unüberwachtes Lernen

Neues Schlaf-Foundation-Modell OSF setzt Maßstäbe in Präzision und Skalierbarkeit

ODAR: Prinzipielle adaptive Routenplanung für LLM-Logik mittels aktiver Inferenz

Neues Training für MoE-Modelle: Experten lernen sich zu spezialisieren

Tiefe Decoder steigern Routing-Modelle: Neue Skalierungsstrategie

Solver-basierte Zertifikate erklären Satellitenplanung präzise

Neues multimodales Retrieval: TTE‑v2 setzt Token‑Skalierung ein

🍪 Cookie-Einstellungen

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

Probabilistisches Träumen verbessert Weltenmodelle um 4,5 %