Suche nach Leistungsverlust

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde gezeigt, dass große Sprachmodelle ihre eigene Leistun…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Bayessche Lotterie-Ticket-Hypothese: Sparsame Netzwerke in BNNs

Bayessche neuronale Netzwerke (BNNs) ermöglichen eine robuste Unsicherheitsquantifizierung, erfordern jedoch deutlich mehr Rechenleistung a…

arXiv – cs.LG 24.02.2026 05:00

Forschung

<h1>LLMs kompaktieren: Schrittweise Reduktion ohne Leistungsverlust</h1> <p>Neues Verfahren aus dem arXiv-Preprint „Gradually Compacting Large Language Models for Reasoning Like a Boiling Frog“ zeigt, wie große Sprachmodelle ohne Qualitätsverlust deutlich kleiner gemacht werden können. Durch gezielte Reduktion der Parameter wird der Rechenaufwand für Inferenz drastisch gesenkt, während die Fähigkeit zum logischen Denken erhalten bleibt.</p> <p>Der Ansatz nutzt einen iterativen Prune‑Tune‑Loop (PTL), bei dem

arXiv – cs.LG 06.02.2026 05:00

Forschung

Feature-Steering: Leistungsverlust trotz Verhaltenskontrolle bei LLMs

Eine neue Studie von Goodfire zeigt, dass Feature‑Steering zwar das Verhalten von Sprachmodellen gezielt beeinflussen kann, dafür aber die…

arXiv – cs.LG 06.02.2026 05:00

Forschung

Flüssige Repräsentationen in Denkmodellen

Ein neues arXiv‑Paper enthüllt, wie Sprachmodelle, die lange Denkhypothesen erzeugen, abstrakte Aufgaben deutlich besser lösen als Modelle…

arXiv – cs.AI 05.02.2026 05:00

Forschung

Erklärbare Prognose für Ultrafiltration: Ähnlichkeitsbasierte Maintenance

In der Umkehrosmose-Wasseraufbereitung verschlechtern sich Ultrafiltration (UF)-Membranen durch Verunreinigungen, was zu Leistungsverlusten…

arXiv – cs.AI 03.02.2026 05:00

Forschung

LLMs meistern Mathe‑Benchmarks, aber im Kontext bleiben sie hinterher

Ein neuer Beitrag auf arXiv (2601.23048v1) beleuchtet, warum große Sprachmodelle, die bei klassischen Mathe‑Tests wie AIME und MATH‑500 nah…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Effizientes, jederzeit sicheres PAC-Reasoning

Ein neues Verfahren namens B‑PAC Reasoning verspricht, große Rechenmodelle für komplexe Aufgaben effizienter zu nutzen, ohne die Genauigkei…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Effiziente Hybrid-Attention-Modelle: Distill-then-Replace Methode

Transformer‑Architekturen setzen weiterhin Maßstäbe in der Genauigkeit, doch ihre quadratische Zeit‑ und Speicherkomplexität bei langen Seq…

arXiv – cs.LG 21.01.2026 05:00

Forschung

Title Triple‑basierte Embeddings verbessern Cluster Klassifikation wissenschaftlicher Texte

**Summary** Triple‑Embeddings bezeichnet die Fusion von drei unterschiedlichen Informationsquellen—Textinhalte, bibliografische Metadaten u…

arXiv – cs.AI 15.01.2026 05:00

Forschung

Sicherheits-Utility-Konflikte sind nicht global: Kopf-Level-Ausrichtung

Die Sicherheit von großen Sprachmodellen (LLMs) stellt ein komplexes Mehrzielproblem dar, bei dem die Optimierung von Sicherheitszielen häu…

arXiv – cs.LG 09.01.2026 05:00

Forschung

TS-DP: Spekulatives Decoding beschleunigt Diffusion-Policy in Echtzeit

Die Diffusion Policy (DP) hat sich als leistungsstarke Methode für die Steuerung von Robotern etabliert, leidet jedoch unter hoher Inferenz…

arXiv – cs.LG 19.12.2025 05:00

Forschung

Neues Kriterium „Expressiveness“ revolutioniert neuronale Netzwerk‑Kompression

In der Welt der künstlichen Intelligenz hat die Pruning‑Technik bereits gezeigt, wie man Modelle schlanker und energieeffizienter macht, oh…

arXiv – cs.LG 09.12.2025 05:00

Forschung

MLPMoE: Zero-Shot Umwandlung dichten LLM-MLPs in statische Mixture-of-Experts

In der Welt der großen Sprachmodelle (LLMs) dominieren dichte Transformer-Architekturen, bei denen jedes Parameter im Feed‑Forward‑Block fü…

arXiv – cs.LG 27.11.2025 05:00

Forschung

Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation

Mit dem rasanten Fortschritt im Deep Learning haben große Sprachmodelle beeindruckende Fähigkeiten in komplexen Rechenaufgaben gezeigt. Ihr…

arXiv – cs.LG 25.11.2025 05:00

Forschung

Latente ODEs revolutionieren Arrhythmieklassifikation bei Wearable-ECGs

Eine neuartige Methode zur Klassifikation von Herzrhythmusstörungen nutzt latente Ordinary Differential Equations (ODEs), um die Analyse vo…

arXiv – cs.LG 24.11.2025 05:00

Aktuell

ScaleOps senkt GPU-Kosten für selbstgehostete LLMs um 50 %

ScaleOps erweitert seine Cloud‑Ressourcen‑Management‑Plattform um ein neues Produkt, das speziell für Unternehmen entwickelt wurde, die gro…

VentureBeat – AI 20.11.2025 17:35

Forschung

MoE-Offloading: Neue Caching‑Strategien und Pre‑Fetching steigern Effizienz

Die Mixture‑of‑Experts‑Architektur (MoE) ist heute ein zentraler Baustein der fortschrittlichsten KI‑Modelle. Durch ihre besondere Struktur…

arXiv – cs.LG 11.11.2025 05:00

Forschung

MERIT: Neuer Optimierer ermöglicht 6.000‑Stichproben‑Batch ohne Leistungsverlust

Die Beschleunigung des Trainings großer neuronaler Netzwerke durch große Batch‑Größen ist heute ein entscheidender Faktor. Gleichzeitig ste…

arXiv – cs.LG 29.08.2025 05:00

Forschung

Organ-Agents: LLM-gesteuerter Simulator repliziert menschliche Physiologie

Mit den neuesten Fortschritten in großen Sprachmodellen (LLMs) ist es nun möglich, komplexe physiologische Systeme realitätsnah zu simulier…

arXiv – cs.LG 21.08.2025 05:00

Forschung

On-Device Few-Shot Learning für personalisierte Aktivitätserkennung in Wearables

Die Erkennung menschlicher Aktivitäten mit Wearables hat in den letzten Jahren enorme Fortschritte gemacht, doch die Modelle verlieren oft…

arXiv – cs.LG 22.08.2025 05:00

Finde Modelle, Firmen und Themen

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

Bayessche Lotterie-Ticket-Hypothese: Sparsame Netzwerke in BNNs

Feature-Steering: Leistungsverlust trotz Verhaltenskontrolle bei LLMs

Flüssige Repräsentationen in Denkmodellen

Erklärbare Prognose für Ultrafiltration: Ähnlichkeitsbasierte Maintenance

LLMs meistern Mathe‑Benchmarks, aber im Kontext bleiben sie hinterher

Effizientes, jederzeit sicheres PAC-Reasoning

Effiziente Hybrid-Attention-Modelle: Distill-then-Replace Methode

**Title** Triple‑basierte Embeddings verbessern Cluster Klassifikation wissenschaftlicher Texte

Sicherheits-Utility-Konflikte sind nicht global: Kopf-Level-Ausrichtung

TS-DP: Spekulatives Decoding beschleunigt Diffusion-Policy in Echtzeit

Neues Kriterium „Expressiveness“ revolutioniert neuronale Netzwerk‑Kompression

MLPMoE: Zero-Shot Umwandlung dichten LLM-MLPs in statische Mixture-of-Experts

Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation

Latente ODEs revolutionieren Arrhythmieklassifikation bei Wearable-ECGs

ScaleOps senkt GPU-Kosten für selbstgehostete LLMs um 50 %

MoE-Offloading: Neue Caching‑Strategien und Pre‑Fetching steigern Effizienz

MERIT: Neuer Optimierer ermöglicht 6.000‑Stichproben‑Batch ohne Leistungsverlust

Organ-Agents: LLM-gesteuerter Simulator repliziert menschliche Physiologie

On-Device Few-Shot Learning für personalisierte Aktivitätserkennung in Wearables

🍪 Cookie-Einstellungen

Title Triple‑basierte Embeddings verbessern Cluster Klassifikation wissenschaftlicher Texte

ScaleOps senkt GPU-Kosten für selbstgehostete LLMs um 50 %