Suche nach Decodierung | meineki.news

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Die neuesten Sparse Mixture-of-Experts (SMoE) Sprachmodelle kombinieren starke Leistungsfähigkeit mit geringer pro‑Token‑Rechenlast. In der…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz hat einen innovativen Ansatz vorgestellt, der die Textgenerierung v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

SUN: Effiziente gemeinsame Token‑Vorhersage für Multi‑LLM‑Serving

In der heutigen Landschaft des Multi‑Model‑LLM‑Servings bleibt die Decodierung häufig ein Flaschenhals. Durch modellspezifische Ressourcen…

arXiv – cs.AI 04.03.2026 05:00

Forschung

<p>Neues Modell: Selbstkorrigierende diskrete Diffusion steigert parallele Decodierung</p> <p>Ein kürzlich auf arXiv veröffentlichtes Papier (2603.02230v1) präsentiert einen innovativen Ansatz zur Verbesserung der parallelen Sampling‑Leistung in diskreten Diffusionsmodellen. Durch die Einführung von Selbstkorrektur kann das Modell die Qualität der generierten Texte beibehalten, während die Effizienz der Parallelverarbeitung deutlich erhöht wird.</p> <p>Frühere Versuche, Selbstkorrektur erst während der Infe

arXiv – cs.LG 04.03.2026 05:00

Praxis

Google AI präsentiert STATIC: 948‑fach schnellere LLM‑basierte Generative Retrieval

Google AI hat mit dem neuen Framework STATIC einen Meilenstein im Bereich der generativen Retrieval‑Technologien gesetzt. Durch die Nutzung…

MarkTechPost 01.03.2026 21:47

Forschung

SideQuest: KV-Cache-Management für langfristige agentische Aufgaben

Ein neues Verfahren namens SideQuest wurde vorgestellt, das die Effizienz von KI-Agenten bei langwierigen Aufgaben deutlich verbessert. Bei…

arXiv – cs.AI 27.02.2026 05:00

Forschung

EPSVec: Effiziente, private Datengenerierung mit Dataset‑Vektoren

In der heutigen KI‑Welt sind hochwertige Daten unverzichtbar, doch viele wertvolle Datensätze sind sensibel und dürfen nicht frei geteilt w…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Sparse Junction Steering: Effiziente Ausrichtung von Sprachmodellen in Echtzeit

Ein neuer Ansatz aus dem arXiv‑Pape r „Inference‑time Alignment via Sparse Junction Steering“ zeigt, dass die bisher dominante Technik der…

arXiv – cs.AI 26.02.2026 05:00

Forschung

AngelSlim: Kompakteres, umfassenderes und effizienteres Toolkit für große Modelle

Das neue Toolkit AngelSlim, entwickelt vom Tencent Hunyuan Team, bietet eine umfassende Lösung zur Kompression großer KI‑Modelle. Durch die…

arXiv – cs.AI 26.02.2026 05:00

Forschung

CHESS: Effiziente, kontextbewusste KV-Cache-Optimierung für LLMs

Ein neues arXiv-Papier (2602.20732v1) präsentiert CHESS, ein innovatives System zur Verwaltung des KV-Caches bei großen Sprachmodellen mit…

arXiv – cs.AI 25.02.2026 05:00

Forschung

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

Ein neues Papier von arXiv (2602.18671v1) präsentiert eine innovative Sichtweise auf die Softmax‑Klassifikation von LLMs als Energie‑basier…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Neuronen speichern exponentiell viele Features – neues mathematisches Modell

Eine neue Studie aus dem Bereich der künstlichen Intelligenz liefert ein mathematisches Rahmenwerk, das die sogenannte lineare Repräsentati…

arXiv – cs.LG 13.02.2026 05:00

Forschung

V-STAR: Wertgesteuerte Stichprobe und Optimierung für generative Empfehlungen

Autoregressive Modelle haben die Suche und das Ranking in einem einzigen generativen Rahmen vereint. Beim Feintuning dieser Modelle mit Rei…

arXiv – cs.AI 12.02.2026 05:00

Forschung

LightGTS-Cov: Modell für Kovariaten-basierte Zeitreihenprognosen

Das neue Modell LightGTS‑Cov erweitert das bereits leichte und zeitspezifische LightGTS um eine gezielte Integration externer Kovariaten. D…

arXiv – cs.LG 12.02.2026 05:00

Forschung

DLLM-Searcher: Effiziente Suchagenten mit Diffusions-LLM

Die jüngste Veröffentlichung auf arXiv (2602.07035v1) präsentiert DLLM-Searcher, ein neues Optimierungsframework, das Diffusions‑Large‑Lang…

arXiv – cs.AI 10.02.2026 05:00

Forschung

SpecAttn: Schnellere LLM‑Inferenz mit sparsamer Attention und Selbst‑Spekulation

Die Inferenz von großen Sprachmodellen mit langen Kontexten ist heute Standard, doch sie wird stark durch die wachsenden Speicheranforderun…

arXiv – cs.LG 10.02.2026 05:00

Forschung

<h1>Sketch-and-Walk: Sparsere Attention für schnellere LLM‑Inferenz</h1> <p>Die Selbstaufmerksamkeit ist der Hauptfaktor, der die Rechen- und Speicherkosten bei der Inferenz von großen Sprachmodellen (LLMs) mit langen Kontexten bestimmt. Sowohl die Vor‑ als auch die Decodierungsphase sind dadurch stark belastet.</p> <p>Um dieses Problem zu lösen, wurde Sketch&Walk Attention entwickelt – ein sparsames Aufmerksamkeitsverfahren, das ohne Training auskommt. Es nutzt Hadamard‑Sketching, um kostengünstige Schätz

arXiv – cs.LG 10.02.2026 05:00

Forschung

HyPER: Dynamische Pfadoptimierung steigert LLM-Logik bei geringem Rechenaufwand

Ein neues Verfahren namens HyPER verspricht, die Rechenleistung von großen Sprachmodellen (LLMs) beim logischen Denken effizienter zu nutze…

arXiv – cs.AI 09.02.2026 05:00

Forschung

Kommunikation stabilisiert strategisches Denken von LLMs

Eine neue Untersuchung auf arXiv zeigt, dass kurze, kostenfreie Vorabnachrichten das strategische Verhalten von großen Sprachmodellen (LLMs…

arXiv – cs.AI 09.02.2026 05:00

Forschung

COVER: Schnellere Diffusion mit kontextbewusster Verifikation

Die Parallelisierung von Diffusionsmodellen kann die Inferenzgeschwindigkeit erheblich steigern, indem mehrere Tokens gleichzeitig entschlü…

arXiv – cs.AI 09.02.2026 05:00

Forschung

POP: Online-Strukturelles Pruning beschleunigt große Foundation-Modelle

Die neue Methode POP (Partition-guided Online Pruning) ermöglicht es, große Foundation‑Modelle (LFMs) während der Inferenz dynamisch zu opt…

arXiv – cs.AI 09.02.2026 05:00

Produkt

Amazon Bedrock liefert strukturierte Ausgaben: Schema-konforme KI-Antworten

Amazon Bedrock hat eine neue Funktion eingeführt, die strukturierte Ausgaben ermöglicht. Damit können Entwickler nun validierte JSON-Antwor…

AWS – Machine Learning Blog 06.02.2026 20:12

Forschung

SDFP: Training‑freies Draft‑Modell für schnelle LLM‑Decodierung

Große Sprachmodelle (LLMs) bilden die Basis für interaktive Multimedia‑Anwendungen wie Untertitelung, Suche, Empfehlung und kreative Inhalt…

arXiv – cs.AI 06.02.2026 05:00

Forschung

CoRe: Kontextrobuste Remasking-Technik verbessert Diffusion-Sprachmodelle

Die Standard-Decodierung in Masked Diffusion Models (MDMs) leidet unter einer zu starren Kontextbehandlung: Tokens werden auf Basis von kur…

arXiv – cs.LG 05.02.2026 05:00

Forschung

LLM-Fehler frühzeitig erkennen: Instabilitätssignal vorhersagt Ausfälle

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wird gezeigt, dass Fehler bei der Beantwortung von Fragen d…

arXiv – cs.AI 04.02.2026 05:00

Forschung

SPA-Cache: Effiziente Caching-Strategie für Diffusions-Sprachmodelle

Diffusions-Sprachmodelle (DLMs) bieten eine flexible Alternative zum autoregressiven Ansatz, doch ihre nicht-kausale Struktur verhindert di…

arXiv – cs.LG 04.02.2026 05:00

Forschung

Neue Technik: Backward-on-Entropy Steering optimiert Masked Diffusion Models

In der Welt der generativen KI haben Masked Diffusion Models (MDMs) kürzlich einen bedeutenden Fortschritt erzielt. Diese Modelle ermöglich…

arXiv – cs.LG 03.02.2026 05:00

Forschung

Neue Studie zeigt, wie LLMs VirtualHome meistern – SSC steigert Leistung

In der Welt der Embodied AI ist es entscheidend, dass Agenten Ziele verstehen, Aktionen planen und Aufgaben in simulierten Umgebungen ausfü…

arXiv – cs.AI 03.02.2026 05:00

Forschung

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

Neues Forschungsergebnis aus dem Bereich der künstlichen Intelligenz beleuchtet, wie Latent Chain-of-Thought (Latent-CoT)-Modelle tatsächli…

arXiv – cs.AI 03.02.2026 05:00

Forschung

S5-Transformer dominiert EEG-Decodierung: 98,7 % Genauigkeit bei 64 s Kontext

In einer neuen Studie wurde untersucht, wie die Architektur eines Modells und die Länge des zeitlichen Kontextes die Leistung bei der Dekod…

arXiv – cs.LG 30.01.2026 05:00

Finde Modelle, Firmen und Themen

EvoESAP: Nicht-Uniformes Expertenpruning für Sparse MoE – Mehr Leistung

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

SUN: Effiziente gemeinsame Token‑Vorhersage für Multi‑LLM‑Serving

Google AI präsentiert STATIC: 948‑fach schnellere LLM‑basierte Generative Retrieval

SideQuest: KV-Cache-Management für langfristige agentische Aufgaben

EPSVec: Effiziente, private Datengenerierung mit Dataset‑Vektoren

Sparse Junction Steering: Effiziente Ausrichtung von Sprachmodellen in Echtzeit

AngelSlim: Kompakteres, umfassenderes und effizienteres Toolkit für große Modelle

CHESS: Effiziente, kontextbewusste KV-Cache-Optimierung für LLMs

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

Neuronen speichern exponentiell viele Features – neues mathematisches Modell

V-STAR: Wertgesteuerte Stichprobe und Optimierung für generative Empfehlungen

LightGTS-Cov: Modell für Kovariaten-basierte Zeitreihenprognosen

DLLM-Searcher: Effiziente Suchagenten mit Diffusions-LLM

SpecAttn: Schnellere LLM‑Inferenz mit sparsamer Attention und Selbst‑Spekulation

HyPER: Dynamische Pfadoptimierung steigert LLM-Logik bei geringem Rechenaufwand

Kommunikation stabilisiert strategisches Denken von LLMs

COVER: Schnellere Diffusion mit kontextbewusster Verifikation

POP: Online-Strukturelles Pruning beschleunigt große Foundation-Modelle

Amazon Bedrock liefert strukturierte Ausgaben: Schema-konforme KI-Antworten

SDFP: Training‑freies Draft‑Modell für schnelle LLM‑Decodierung

CoRe: Kontextrobuste Remasking-Technik verbessert Diffusion-Sprachmodelle

LLM-Fehler frühzeitig erkennen: Instabilitätssignal vorhersagt Ausfälle

SPA-Cache: Effiziente Caching-Strategie für Diffusions-Sprachmodelle

Neue Technik: Backward-on-Entropy Steering optimiert Masked Diffusion Models

Neue Studie zeigt, wie LLMs VirtualHome meistern – SSC steigert Leistung

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

S5-Transformer dominiert EEG-Decodierung: 98,7 % Genauigkeit bei 64 s Kontext

🍪 Cookie-Einstellungen

S5-Transformer dominiert EEG-Decodierung: 98,7 % Genauigkeit bei 64 s Kontext