Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “RACI”
Forschung

**Punkt 1 – Warum ist die „Klassische“ Lernrate nicht optimal?** Die Lernrate bestimmt, wie stark die Gewichte bei jedem Schritt angepasst werden. * **Zu groß** → große Sprünge, das Modell kann die optimale Lösung überspringen und oszillieren. * **Zu klein** → sehr lange Konvergenz, das Modell kann in lokalen Minima stecken bleiben. * **Statische Lernrate** → die optimale Schrittweite ändert sich im Verlauf des Trainings (z. B. wenn die Fehlerkurve flacher wird). Daher ist eine feste Lernrate oft

arXiv – cs.AI
Forschung

<h1>Öffentliche Intelligenz: Machtverteilung und Beteiligung im Modellökosystem</h1> <p>Seit 2019 ist der Hugging Face Model Hub die zentrale Plattform für die weltweite Verbreitung von Open‑Weight‑KI‑Modellen. Mit der Veröffentlichung eines Datensatzes, der die komplette Historie der wöchentlichen Modelldownloads von Juni 2020 bis August 2025 sowie umfangreiche Metadaten umfasst, liefert die Studie die bislang strengste Analyse der Konzentrationsdynamik und der sich wandelnden Merkmale der Open‑Model‑Wirts

arXiv – cs.AI
Forschung

<h1>HISE-KT: KI vereint heterogene Netzwerke und Sprachmodelle für Lernverfolgung</h1> <p>HISE-KT ist ein neu entwickeltes Framework, das die Stärken von heterogenen Informationsnetzwerken (HINs) mit der Leistungsfähigkeit großer Sprachmodelle (LLMs) kombiniert, um die Lernverfolgung (Knowledge Tracing) präziser und nachvollziehbarer zu gestalten.</p> <p>Traditionelle HIN-basierte Ansätze wählen Meta‑Paths oft manuell oder zufällig aus, was zu Rauschen führt und die Qualität der Pfade nicht bewertet. Gleich

arXiv – cs.AI
Forschung

<h1>LLMs: Neue Methode trennt Halluzinationen und nutzt Aufmerksamkeitsmuster</h1> <p>In einer kürzlich veröffentlichten Studie auf arXiv wird ein innovatives Evaluationsframework vorgestellt, das zwischen extrinsischen und intrinsischen Halluzinationen in großen Sprachmodellen unterscheidet. Das Ziel ist es, die Erkennungsleistung gezielt zu verbessern, indem die unterschiedlichen Halluzinationstypen berücksichtigt werden.</p> <p>Die Autoren nutzen einen auf Aufmerksamkeitsmechanismen basierenden Ansatz zu

arXiv – cs.LG