Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Interaktiv”
Forschung

Neue interaktive Benchmarks: So testen wir KI wirklich<br/><p>Standard-Benchmarks werden zunehmend unzuverlässig, weil sie gesättigt, subjektiv und schlecht generalisierbar sind. Aus diesem Grund stellen die Autoren des arXiv‑Papiers (2603.04737v1) ein neues Evaluationsparadigma vor: Interaktive Benchmarks. Dabei wird die Fähigkeit eines Modells gemessen, aktiv Informationen zu beschaffen und damit seine Intelligenz zu demonstrieren.</p><p>Das Konzept umfasst zwei Hauptbereiche. In „Interactive Proofs“ arbe

arXiv – cs.AI
Aktuell

<h1>Chatbot „Who’s Your Daddy?“: KI als Türöffner für BDSM‑Fantasien</h1> <p>Immer mehr Menschen nutzen KI, um ihre BDSM‑Fantasien auszuleben, doch in der Community gibt es Stimmen, die das als Ausrede sehen.</p> <p>Der neue Chatbot „Who’s Your Daddy?“ ermöglicht interaktive Rollenspiele, die zuvor nur in realen Begegnungen möglich waren. Während Befürworter die Freiheit und Anonymität betonen, kritisieren einige Nutzer, dass die virtuelle Erfahrung die echte zwischenmenschliche Verbindung ersetzt.</p>

Wired – AI (Latest)
Forschung

HiPER: Hierarchisches RL mit expliziter Kreditzuweisung verbessert LLM-Agenten<br/><p>Die neue Methode HiPER löst ein zentrales Problem bei der Nutzung von großen Sprachmodellen (LLMs) als interaktive Agenten: In Aufgaben mit langen Entscheidungsfolgen und spärlichen, verzögerten Belohnungen ist es schwierig, die Verantwortung für einzelne Aktionen korrekt zuzuordnen. Traditionelle Reinforcement‑Learning‑Ansätze behandeln LLMs als flache Richtlinien, die bei jedem Schritt nur eine Aktion wählen. Dadurch mus

arXiv – cs.LG