KI News: Kurz und klar.

Anmelden

Shared Parameter Subspaces and Cross-Task Linearity in Emergently Misaligned Behavior

arXiv – cs.LG • 05.11.2025 05:00 • Original

#emergent misalignment #Large Language Models #Fine-tuning #Geometric Analysis #Cross-task Linear Structure #Parameter Convergence #Linear Mode Connectivity

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 02.02.2026 05:00

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

arXiv – cs.LG • 27.01.2026 05:00

AGZO: Aktivitätsgesteuerte Zeroth-Order-Optimierung verbessert LLM-Fine‑Tuning

arXiv – cs.AI • 22.01.2026 05:00

RISE: Real‑to‑Virtual Trajektorien reduzieren Intentionabweichungen bei Tool‑Agenten

arXiv – cs.AI • 25.11.2025 05:00

Große Sprachmodelle lernen Belohnungs-Hacking: Risiko von Missalignment

arXiv – cs.AI • 29.10.2025 04:00

Fine-tuning Large Language Models with Limited Data: A Survey and Practical Guide

arXiv – cs.AI • 20.10.2025 05:00

Self-evolving expertise in complex non-verifiable subject domains: dialogue as implicit meta-RL