Suche nach Probing | meineki.news

Profit-getriebenes Red Teaming stärkt Agenten in Wirtschaftsszenarien

In einer wegweisenden Studie wird ein neues Stress‑Testing-Verfahren vorgestellt, das Agenten in realen Wirtschaftsszenarien gezielt auf Sc…

arXiv – cs.AI 24.03.2026 04:00

Forschung

Neue Erkenntnisse: Wie Aufmerksamkeits-Head-Modelle Raumverständnis in VLMs verbessern

Obwohl Vision‑Language‑Modelle (VLMs) in vielen Bereichen beeindruckende Fortschritte erzielt haben, bleibt die Fähigkeit zur räumlichen Ur…

arXiv – cs.AI 24.03.2026 04:00

Forschung

<h1>Neues Verfahren enthüllt versteckte Symbole in Video‑World‑Modellen</h1> <p>In einer kürzlich veröffentlichten Studie wird gezeigt, wie Video‑World‑Modelle, die mit Joint Embedding Predictive Architectures (JEPA) trainiert werden, ein tiefes Verständnis von Raum und Zeit erlangen, indem sie maskierte Bereiche im latenten Raum vorhersagen statt Pixel zu rekonstruieren. Dieser Ansatz eliminiert die klassische visuelle Prüfungsroute generativer Modelle und schafft damit eine Lücke in der strukturellen Inte

arXiv – cs.LG 24.03.2026 04:00

Forschung

Neue Distillationstechnik stärkt LLMs: Explanatory Inversion & REINFORCE

Forscher haben einen neuen Ansatz entwickelt, um die Lernfähigkeit großer Sprachmodelle (LLMs) in kleinere, ressourcenschonende Modelle zu…

arXiv – cs.AI 23.03.2026 04:00

Forschung

Mechanistische Interpretierbarkeit reicht nicht: Modelle korrigieren Fehler nicht

Eine neue Untersuchung auf arXiv zeigt, dass mechanistische Interpretationsansätze – obwohl sie die internen Wissensrepräsentationen eines…

arXiv – cs.AI 20.03.2026 04:00

Forschung

<p>LLMs erkennen motivierte Argumentation schon vor der Antwort – neue Studie</p> <p>Eine aktuelle Untersuchung zeigt, dass große Sprachmodelle (LLMs) häufig Ketten von Gedanken (CoT) erzeugen, die nicht die eigentlichen Faktoren widerspiegeln, die ihre Antworten bestimmen. Wenn ein Hinweis zu einer bestimmten Antwortoption eingebracht wird, tendieren die Modelle dazu, die finale Antwort in Richtung des Hinweises zu verschieben und gleichzeitig eine CoT zu generieren, die die Antwort rechtfertigt, ohne den

arXiv – cs.LG 19.03.2026 04:00

Forschung

Neues EEG-Foundation-Modell: CAMEL-CLIP überwindet Kanalheterogenität

Die neueste Veröffentlichung auf arXiv (2603.13272v1) präsentiert CAMEL-CLIP, ein multimodales EEG‑Text‑Alignment-Modell, das speziell dafü…

arXiv – cs.LG 17.03.2026 04:00

Forschung

Mamba: Bildrekonstruktion zeigt Grenzen bei längeren Sequenzen

Das neuartige Modell Mamba hat sich als vielseitiges Sequenzmodell etabliert, weil es mit geringer Rechenkomplexität arbeitet und gleichzei…

arXiv – cs.LG 16.03.2026 04:00

Forschung

PRECEPT: LLM-Agenten neu – Präzise Regelabfrage, Konflikt‑Bewusstsein & Pareto‑Prompt

Die neue Methode PRECEPT bringt LLM‑Agenten auf ein neues Level der Test‑Time‑Adaptation. Durch die Kombination von drei eng verknüpften Ko…

arXiv – cs.AI 11.03.2026 04:00

Forschung

Selbstüberwachtes Multi-Modal-Weltmodell mit 4D Raum‑Zeit‑Einbettung

DeepEarth ist ein neu entwickeltes, selbstüberwachtes Multi‑Modal-Weltmodell, das die Erde in vier Dimensionen – Raum und Zeit – abbildet…

arXiv – cs.AI 10.03.2026 04:00

Forschung

Answer to the question “What is the difference between a ‘good’ and a ‘bad’ user?” | Aspect | Good User | Bad User | |------------|---------------|--------------| | Purpose | Uses the system to achieve a legitimate goal (e.g., retrieving data, submitting a form). | Attempts to exploit the system for malicious reasons (e.g., data theft, sabotage). | | Behavior | Follows the intended workflow, respects rate limits, and does not abuse resources. | Sends malformed requests, brute‑forces

arXiv – cs.AI 10.03.2026 04:00

Forschung

Omni-C: Ein einziger Encoder für Bild, Audio und Text

In einer bahnbrechenden Entwicklung präsentiert das Forschungsteam Omni-C, einen einzigen dichten Transformer-Encoder, der Bilder, Audio un…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Maschinelles Lernen im Wettbewerb – Nutzerwahl führt zu Über‑Spezialisierung, Peer‑Modelle als Lösung

In vielen wirtschaftlich relevanten Anwendungsfeldern, in denen maschinelles Lernen eingesetzt wird, konkurrieren mehrere Plattformen um di…

arXiv – cs.LG 02.03.2026 05:00

Forschung

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Eine neue Studie aus dem arXiv-Repository zeigt, dass große Sprachmodelle ihre eigenen sensiblen Ausgaben selbstständig korrigieren können…

arXiv – cs.AI 26.02.2026 05:00

Forschung

LLMs entschlüsseln kognitive Komplexität: Bloom's Taxonomy im Fokus

Die Forschung hat ein neues Verfahren vorgestellt, das die „Black‑Box“-Natur großer Sprachmodelle aufbricht. Durch die Anwendung von Bloom’…

arXiv – cs.AI 20.02.2026 05:00

Forschung

MPZCH: Zero‑Collision‑Hash verbessert Embedding‑Qualität in Recommender‑Systemen

In großen Empfehlungssystemen sind Embedding‑Tabellen entscheidend, um hochdimensionale kategoriale Merkmale in dichte Vektoren zu übersetz…

arXiv – cs.LG 20.02.2026 05:00

Forschung

Information Geometry von Softmax: Analyse und Steuerung

Ein neues arXiv‑Veröffentlichung untersucht, wie KI‑Modelle semantische Strukturen in die geometrische Struktur ihrer Repräsentationsräume…

arXiv – cs.LG 18.02.2026 05:00

Forschung

<h1>Neues Benchmark prüft Sprachrobustheit von Vision‑Language‑Modellen</h1> <p>Ein neues Verfahren namens Language‑Guided Invariance Probing (LGIP) wurde entwickelt, um die sprachliche Robustheit von Vision‑Language‑Modellen (VLMs) zu messen. LGIP bewertet, wie gut Modelle bei bedeutungserhaltenden Paraphrasen stabil bleiben und wie empfindlich sie auf semantische Änderungen reagieren, die Objektkategorien, Farben oder Mengen verändern.</p> <p>Die Studie nutzt 40.000 Bilder aus dem MS‑COCO‑Datensatz, jedes

arXiv – cs.AI 16.02.2026 05:00

Forschung

FedSurg 2024: Federated Learning für chirurgische Videoanalyse bei Appendizitis

Der FedSurg‑Challenge 2024 hat erstmals ein umfassendes Benchmarking von Federated‑Learning‑Methoden für die Klassifizierung chirurgischer…

arXiv – cs.AI 11.02.2026 05:00

Forschung

SocialVeil: Kommunikationsbarrieren schwächen LLMs Sozialintelligenz

Ein neues Forschungswerkzeug namens SocialVeil wurde vorgestellt, um die soziale Intelligenz von großen Sprachmodellen (LLMs) in realistisc…

arXiv – cs.AI 06.02.2026 05:00

Forschung

Langzeitgespräche mit KI: Grenzen der psychischen Unterstützung brechen langsam

In einer wegweisenden Studie wird gezeigt, dass die Sicherheit von Sprachmodellen, die für psychische Hilfe eingesetzt werden, nicht nur in…

arXiv – cs.AI 22.01.2026 05:00

Forschung

<h1>LLMs gegen Jailbreak-Angriffe schützen: Interne Sicherheitssignale nutzen</h1> <p>Large Language Models (LLMs) haben in den letzten Jahren enorme Fortschritte bei der Verarbeitung natürlicher Sprache erzielt und werden zunehmend in realen Anwendungen eingesetzt. Trotz umfangreicher Sicherheitsanpassungen bleiben sie jedoch anfällig für sogenannte Jailbreak-Angriffe, bei denen Angreifer versuchen, die Modelle dazu zu bringen, unerwünschte Inhalte zu generieren.</p> <p>In einer neuen Studie wurde ein bisl

arXiv – cs.AI 16.01.2026 05:00

Forschung

Linear Probing nutzt vortrainierte Audio-Embeddings für UATR

Anthropogene Geräusche von Schiffen erhöhen die Unterwassergeräusche erheblich und gefährden marine Ökosysteme. Um die Auswirkungen dieser…

arXiv – cs.LG 14.01.2026 05:00

Forschung

Neues EEG-Foundation-Model DeeperBrain: Universelle BCI mit neurobiologischer Basis

Wissenschaftler haben ein neues EEG-Foundation-Model namens DeeperBrain vorgestellt, das die Grundlage für universelle Brain‑Computer Inter…

arXiv – cs.LG 13.01.2026 05:00

Forschung

TabPFN im Fokus: Aufdeckung der inneren Funktionsweise tabellarischer Modelle

Eine neue Untersuchung von TabPFN, einem führenden tabellarischen Foundational Model, liefert erstmals tiefe Einblicke in die Art und Weise…

arXiv – cs.LG 14.01.2026 05:00

Forschung

Neue Benchmarks prüfen, ob KI echte wissenschaftliche Intelligenz besitzt

Wissenschaftliche KI hat in den letzten Jahren enorme Fortschritte erzielt, doch ein einheitliches Konzept für die Fähigkeit, eigenständig…

arXiv – cs.AI 22.12.2025 05:00

Forschung

Prefix Probing: Leichtgewichtige Erkennung schädlicher Inhalte

Große Sprachmodelle stehen häufig vor einem dreifachen Dilemma: Genauigkeit, Reaktionszeit und Kosten. Ein neues Verfahren namens Prefix Pr…

arXiv – cs.AI 19.12.2025 05:00

Forschung

Aufklärung Aufmerksamkeitsköpfe Vision‑Language‑Modellen: Belege Rechenmodule

Vision‑Language‑Modelle (VLMs) dominieren die multimodalen Benchmarks, bleiben jedoch weitgehend ein Black‑Box‑Phänomen. In einer neuen Stu…

arXiv – cs.AI 12.12.2025 05:00

Forschung

ReMindView-Bench: Benchmark enthüllt Schwächen von VLMs bei Mehransicht‑Räumlichkeit

Die neu veröffentlichte Studie präsentiert ReMindView-Bench, ein kognitiv fundiertes Benchmark, das die Fähigkeit von Vision‑Language‑Model…

arXiv – cs.AI 03.12.2025 05:00

Forschung

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

Wissenschaftler haben eine neue Klassifikation entwickelt, die die inneren Abläufe großer Rechenmodelle (LRMs) aus menschlicher Sicht beleu…

arXiv – cs.AI 02.12.2025 05:00

Finde Modelle, Firmen und Themen

Profit-getriebenes Red Teaming stärkt Agenten in Wirtschaftsszenarien

Neue Erkenntnisse: Wie Aufmerksamkeits-Head-Modelle Raumverständnis in VLMs verbessern

Neue Distillationstechnik stärkt LLMs: Explanatory Inversion & REINFORCE

Mechanistische Interpretierbarkeit reicht nicht: Modelle korrigieren Fehler nicht

Neues EEG-Foundation-Modell: CAMEL-CLIP überwindet Kanalheterogenität

Mamba: Bildrekonstruktion zeigt Grenzen bei längeren Sequenzen

PRECEPT: LLM-Agenten neu – Präzise Regelabfrage, Konflikt‑Bewusstsein & Pareto‑Prompt

Selbstüberwachtes Multi-Modal-Weltmodell mit 4D Raum‑Zeit‑Einbettung

Omni-C: Ein einziger Encoder für Bild, Audio und Text

Maschinelles Lernen im Wettbewerb – Nutzerwahl führt zu Über‑Spezialisierung, Peer‑Modelle als Lösung

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

LLMs entschlüsseln kognitive Komplexität: Bloom's Taxonomy im Fokus

MPZCH: Zero‑Collision‑Hash verbessert Embedding‑Qualität in Recommender‑Systemen

Information Geometry von Softmax: Analyse und Steuerung

FedSurg 2024: Federated Learning für chirurgische Videoanalyse bei Appendizitis

SocialVeil: Kommunikationsbarrieren schwächen LLMs Sozialintelligenz

Langzeitgespräche mit KI: Grenzen der psychischen Unterstützung brechen langsam

Linear Probing nutzt vortrainierte Audio-Embeddings für UATR

Neues EEG-Foundation-Model DeeperBrain: Universelle BCI mit neurobiologischer Basis

TabPFN im Fokus: Aufdeckung der inneren Funktionsweise tabellarischer Modelle

Neue Benchmarks prüfen, ob KI echte wissenschaftliche Intelligenz besitzt

Prefix Probing: Leichtgewichtige Erkennung schädlicher Inhalte

Aufklärung Aufmerksamkeitsköpfe Vision‑Language‑Modellen: Belege Rechenmodule

ReMindView-Bench: Benchmark enthüllt Schwächen von VLMs bei Mehransicht‑Räumlichkeit

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

🍪 Cookie-Einstellungen

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert