Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Dateien”
Forschung

<h1>AgentHazard: Benchmark enthüllt Schwachstellen autonomer Computeragenten</h1> <p>Ein neues Benchmark namens AgentHazard wurde entwickelt, um die Gefahr von schädlichem Verhalten bei Computer‑Use‑Agenten zu untersuchen. Diese Agenten bauen auf Sprachmodellen auf, übernehmen jedoch die Fähigkeit, über Tools, Dateien und Ausführungsumgebungen hinweg persistente Aktionen auszuführen. Im Gegensatz zu herkömmlichen Chat‑Systemen behalten sie ihren Zustand über mehrere Interaktionen hinweg bei und wandeln Zwis

arXiv – cs.AI
Forschung

<h1>LLM-Agenten vs klassische HPO: Hybrid‑Centaur triumphiert</h1> <p>Eine neue Studie aus dem arXiv‑Repository <em>autoresearch</em> untersucht, ob große Sprachmodelle (LLMs) die klassischen Hyperparameter‑Optimierungsalgorithmen (HPO) übertreffen können. Dabei wird ein LLM-Agent eingesetzt, der die Trainingscode‑Dateien direkt bearbeitet, um optimale Hyperparameter‑Konfigurationen zu finden.</p> <p>Im Vergleich zu etablierten Verfahren wie CMA‑ES und TPE zeigen klassische HPO‑Methoden in einem fest defini

arXiv – cs.LG
Forschung

KI-Agenten revolutionieren Sozialforschung: Können sie Wissenschaftler ersetzen?<p>In der neuesten Veröffentlichung auf arXiv wird beschrieben, wie KI-Agenten – Systeme, die mehrstufige Denkprozesse mit dauerhaftem Speicher, Tool-Zugriff und fachspezifischen Fähigkeiten ausführen – die Sozialforschung grundlegend verändern. Im Gegensatz zu herkömmlichen Chatbots, die nur auf einzelne Anfragen reagieren, können diese Agenten Dateien lesen, Code ausführen, Datenbanken abfragen, das Web durchsuchen und domänen

arXiv – cs.AI