Suche nach Optimizer | meineki.news

End-to-End-Optimierung mit NVIDIA Model Optimizer: FastNAS-Pruning & Feintuning

In diesem Tutorial wird gezeigt, wie man in Google Colab eine komplette End‑zu‑End‑Pipeline mit dem NVIDIA Model Optimizer aufbaut. Dabei w…

MarkTechPost 03.04.2026 07:48

Forschung

Zwei-Stufen-Ansatz für Optimierer‑bewusste Online-Datenauswahl bei LLMs

Forscher haben einen neuen Ansatz entwickelt, um Daten für das Feintuning großer Sprachmodelle effizienter auszuwählen. Der innovative Rahm…

arXiv – cs.AI 02.04.2026 04:00

Forschung

<h1>LLM-gestützte Optimierung: Greedy Hill Climbing bleibt die beste Wahl</h1> <p>Eine neue Studie auf arXiv zeigt, dass die klassische Optimierungsmethode des Greedy Hill Climbing, wenn sie mit einem großen Sprachmodell (LLM) kombiniert wird, in einer Vielzahl von Aufgaben die Nase vorn hat. Statt zufälliger Vorschläge generiert das LLM gezielt Kandidaten, indem es die Bewertungsergebnisse analysiert und daraus Schlüsse zieht.</p> <p>Die Autoren testeten ihr Konzept an vier unterschiedlichen Problemen: bei

arXiv – cs.AI 31.03.2026 04:00

Forschung

Zwei-Phasen-Optimierer: Neue Theorie für hochdimensionale Modelle

Der Trend zu immer größeren Trainingsumgebungen hat das Interesse an teilweise asynchronen Zwei-Phasen-Optimierern neu entfacht. Diese Verf…

arXiv – cs.LG 31.03.2026 04:00

Forschung

AscendOptimizer: KI-Agent steigert Huawei Ascend NPU-Performance um 19 %

Huawei hat mit AscendOptimizer einen neuen KI‑Agenten vorgestellt, der die Optimierung von AscendC‑Operatoren auf den Ascend‑Neural‑Process…

arXiv – cs.LG 26.03.2026 04:00

Forschung

Neue Blaupause für kontinuierliche Verbesserung von Multi-Agenten-Einkaufsassistenten

Ein neues arXiv-Papier (2603.03565v1) präsentiert einen praxisnahen Leitfaden zur Bewertung und Optimierung von konversationellen Einkaufsa…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Optimierer formen Lernpfade: Drift und Transversalität bei Transformers

In einer neuen Untersuchung von arXiv‑Studien wird die Geometrie von Trainingspfaden in kleinen Transformer‑Modellen genauer beleuchtet. Da…

arXiv – cs.LG 02.03.2026 05:00

Forschung

GIST: Datenauswahl für Instruction Tuning mit gekoppeltem Optimierungsgeometrie

Eine neue Methode namens GIST (Gradient Isometric Subspace Transformation) bringt frischen Wind in die gezielte Datenauswahl für Instructio…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Arcee präsentiert Trinity Large: 400 Billionen Parameter, neue MoE-Strategie

Arcee AI hat heute den technischen Bericht zu ihrem neuesten Sprachmodell Trinity Large veröffentlicht. Das sparsamente Mixture-of-Experts-…

arXiv – cs.LG 20.02.2026 05:00

Forschung

IntentCUA: Intention-basierte Planung für effiziente Desktop‑Automatisierung

Ein brandneues Framework namens IntentCUA hat die Art und Weise, wie Computer‑Use‑Agents lange Aufgaben ausführen, revolutioniert. Durch di…

arXiv – cs.AI 20.02.2026 05:00

Forschung

<h1>Maskierte Updates steigern LLM-Training: Neue Methode übertrifft Adam</h1> <p>Die Entwicklung großer Sprachmodelle (LLMs) stützt sich bislang fast ausschließlich auf adaptive Optimierer mit komplexen Präconditionern. Eine neue Studie zeigt jedoch, dass das zufällige Maskieren von Parameterupdates überraschend wirksam ist und sogar die neuesten Optimierer übertrifft.</p> <p>Insbesondere ein maskierter RMSProp-Ansatz liefert konsequent bessere Ergebnisse als aktuelle Spitzenoptimierer. Die Autoren erkläre

arXiv – cs.LG 18.02.2026 05:00

Forschung

Zero-Order Optimierung für LLM-Fine-Tuning: Lernbare Richtungsabtastung

Das Feintuning großer vortrainierter Sprachmodelle (LLMs) ist ein zentraler Baustein moderner NLP-Anwendungen, doch die damit einhergehende…

arXiv – cs.LG 17.02.2026 05:00

Forschung

POP: Meta-Optimizer übertrifft klassische Methoden bei komplexen Optimierungen

In der Welt der Optimierung, wo das Finden von Extrema oft von der Feinabstimmung von Lernraten und Momentum abhängt, präsentiert ein neues…

arXiv – cs.LG 18.02.2026 05:00

Forschung

TrasMuon: Vertrauenbasierte Skalierung für orthogonale Momentum-Optimierer

Muons, eine Familie von Optimierern, nutzt Newton-Schulz-Iteration, um die Update-Schritte zu orthogonalisieren. Dadurch entsteht eine nahe…

arXiv – cs.LG 17.02.2026 05:00

Forschung

Spectra: Optimierer für LLMs neu gedacht – Anisotrope Spektren im Fokus

In der Ausbildung großer Sprachmodelle (LLMs) zeigen Gradientensignale eine starke Anisotropie: die wiederkehrende sprachliche Struktur kon…

arXiv – cs.LG 13.02.2026 05:00

Forschung

WSBD: Neuer Optimierer für Quantenneuronale Netze beschleunigt Training um 64 %

Die Schulung von Quantenneuronalen Netzen (QNNs) ist bislang stark durch den hohen Rechenaufwand für Gradientenabschätzungen und das sogena…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Neuer Transformer-Optimierer verbessert Web-Scale Zeitreihenprognosen und Bildanalyse

Ein neues Forschungsergebnis aus dem Bereich der künstlichen Intelligenz verspricht, die Art und Weise, wie große Web-Daten analysiert werd…

arXiv – cs.LG 04.02.2026 05:00

Forschung

UNSO: Neue, stabile Newton-Schulz-Optimierung für effiziente Matrixberechnungen

Die Newton-Schulz-Iteration hat sich in den letzten Jahren als Schlüsselverfahren für den Muon-Optimizer und die Arbeit mit dem Stiefel-Man…

arXiv – cs.LG 04.02.2026 05:00

Forschung

Riemannian Lyapunov Optimizer: Einheitlicher Ansatz für Optimierung

In einer wegweisenden Veröffentlichung stellt ein Forschungsteam die Riemannian Lyapunov Optimizers (RLOs) vor – eine neue Familie von Opti…

arXiv – cs.LG 02.02.2026 05:00

Forschung

DARA: KI-gestützte Budgetallokation in Online‑Werbung mit Few‑Shot‑Ansatz

Werbetreibende stehen vor der komplexen Aufgabe, den Gesamtwert gewonnenen Impressionen innerhalb knapper Budgets zu maximieren. Dabei fehl…

arXiv – cs.AI 22.01.2026 05:00

Forschung

Verbesserte Modelloptimierung: Muon-basierte Distillation & Quantisierung für LLMs

Large Language Models (LLMs) haben die Verarbeitung natürlicher Sprache revolutioniert, doch ihre hohe Rechen-, Speicher- und Energieanford…

arXiv – cs.LG 16.01.2026 05:00

Forschung

ZeroRouter: Kosten‑effiziente, Zero‑Shot-LLM-Routing-Lösung ohne Modell‑Lock‑In

Die rasante Verbreitung von Large Language Models (LLMs) hat ein fragmentiertes und ineffizientes Ökosystem geschaffen, in dem die nahtlose…

arXiv – cs.LG 13.01.2026 05:00

Forschung

Gradienten in Deep Learning: Vorhersagbare Pfade und niedrige Rangstruktur

Die Optimierung von Deep‑Learning‑Modellen weist eine Struktur auf, die klassische Worst‑Case‑Gradientenschätzungen nicht erfassen. In der…

arXiv – cs.LG 09.01.2026 05:00

Produkt

LLM-Inference auf Amazon SageMaker AI mit BentoMLs LLM-Optimizer optimieren

Amazon SageMaker AI ermöglicht die schnelle Bereitstellung von großen Sprachmodellen, doch die optimale Konfiguration für Latenz, Durchsatz…

AWS – Machine Learning Blog 24.12.2025 17:17

Forschung

GreedySnake steigert SSD-gestütztes LLM-Training um bis zu 2,5×

GreedySnake ist ein neues System für das SSD‑offloaded Training von großen Sprachmodellen (LLMs) und macht das Training dadurch deutlich ko…

arXiv – cs.LG 22.12.2025 05:00

Forschung

TiCard: KI-basierte Korrektur für Kardinalitätsabschätzungen ohne Integration

Die Genauigkeit der Kardinalitätsabschätzung ist ein entscheidender Engpass bei der kostenbasierten Optimierung von Datenbankabfragen. Klas…

arXiv – cs.AI 17.12.2025 05:00

Forschung

Automatisierte Optimierer: Schnellere Gradient‑Lernprozesse

Ein neues arXiv‑Veröffentlichung legt die theoretische Basis für die automatische Gestaltung von Optimierern in gradientbasierten Lernverfa…

arXiv – cs.LG 09.12.2025 05:00

Forschung

Matrix-Preconditionierte Optimierer liefern stabile Geschwindigkeitsvorteile Skalierung

In jüngster Zeit haben Optimierer, die Matrix‑Preconditioning einsetzen, vielversprechende Beschleunigungen gegenüber dem derzeit dominante…

arXiv – cs.LG 08.12.2025 05:00

Forschung

<h1>Wann profitieren Deep‑Learning‑Modelle von spektralen Gradientenupdates?</h1> <p>In der Welt des Deep Learning haben spektrale Gradientenmethoden – darunter der neu aufgelegte Muon‑Optimizer – großes Interesse geweckt. Sie stellen eine Alternative zum klassischen euklidischen Gradientenabstieg dar, doch bislang war unklar, in welchen Situationen sie tatsächlich überlegen sind.</p> <p>Die neue Studie liefert dafür eine klare Antwort: Sie führt eine einfache, schichtweise Bedingung ein, die vorhersagt, wa

arXiv – cs.LG 05.12.2025 05:00

Forschung

QIBONN: Quanteninspiriertes Optimierungsverfahren für Netze bei Klassifikation

Die neueste Veröffentlichung auf arXiv (2511.08940v1) stellt QIBONN vor – einen quanteninspirierten Bilevel-Optimizer, der Hyperparameterop…

arXiv – cs.LG 13.11.2025 05:00

Finde Modelle, Firmen und Themen

End-to-End-Optimierung mit NVIDIA Model Optimizer: FastNAS-Pruning & Feintuning

Zwei-Stufen-Ansatz für Optimierer‑bewusste Online-Datenauswahl bei LLMs

Zwei-Phasen-Optimierer: Neue Theorie für hochdimensionale Modelle

AscendOptimizer: KI-Agent steigert Huawei Ascend NPU-Performance um 19 %

Neue Blaupause für kontinuierliche Verbesserung von Multi-Agenten-Einkaufsassistenten

Optimierer formen Lernpfade: Drift und Transversalität bei Transformers

GIST: Datenauswahl für Instruction Tuning mit gekoppeltem Optimierungsgeometrie

Arcee präsentiert Trinity Large: 400 Billionen Parameter, neue MoE-Strategie

IntentCUA: Intention-basierte Planung für effiziente Desktop‑Automatisierung

Zero-Order Optimierung für LLM-Fine-Tuning: Lernbare Richtungsabtastung

POP: Meta-Optimizer übertrifft klassische Methoden bei komplexen Optimierungen

TrasMuon: Vertrauenbasierte Skalierung für orthogonale Momentum-Optimierer

Spectra: Optimierer für LLMs neu gedacht – Anisotrope Spektren im Fokus

WSBD: Neuer Optimierer für Quantenneuronale Netze beschleunigt Training um 64 %

Neuer Transformer-Optimierer verbessert Web-Scale Zeitreihenprognosen und Bildanalyse

UNSO: Neue, stabile Newton-Schulz-Optimierung für effiziente Matrixberechnungen

Riemannian Lyapunov Optimizer: Einheitlicher Ansatz für Optimierung

DARA: KI-gestützte Budgetallokation in Online‑Werbung mit Few‑Shot‑Ansatz

Verbesserte Modelloptimierung: Muon-basierte Distillation & Quantisierung für LLMs

ZeroRouter: Kosten‑effiziente, Zero‑Shot-LLM-Routing-Lösung ohne Modell‑Lock‑In

Gradienten in Deep Learning: Vorhersagbare Pfade und niedrige Rangstruktur

LLM-Inference auf Amazon SageMaker AI mit BentoMLs LLM-Optimizer optimieren

GreedySnake steigert SSD-gestütztes LLM-Training um bis zu 2,5×

TiCard: KI-basierte Korrektur für Kardinalitätsabschätzungen ohne Integration

Automatisierte Optimierer: Schnellere Gradient‑Lernprozesse

Matrix-Preconditionierte Optimierer liefern stabile Geschwindigkeitsvorteile Skalierung

QIBONN: Quanteninspiriertes Optimierungsverfahren für Netze bei Klassifikation

🍪 Cookie-Einstellungen

AscendOptimizer: KI-Agent steigert Huawei Ascend NPU-Performance um 19 %

Arcee präsentiert Trinity Large: 400 Billionen Parameter, neue MoE-Strategie

WSBD: Neuer Optimierer für Quantenneuronale Netze beschleunigt Training um 64 %