AI-Alignment neu gedacht: Von Verhalten zu Institutionen
Ein neues Papier auf arXiv präsentiert einen radikalen Ansatz, um die Sicherheit von KI-Systemen zu verbessern. Statt ausschließlich auf externe Beobachter und Rückmeldungen zu setzen, schlägt die Arbeit vor, die gesamt…