Suche nach Komplexe Aufgaben

openJiuwen Community präsentiert „JiuwenClaw“: KI-Agent für Aufgabenmanagement

Seit den 1990er Jahren hat die KI die Welt in vielerlei Hinsicht revolutioniert. Von der Automatisierung von Arbeitsprozessen bis hin zur E…

MarkTechPost 27.03.2026 17:02

Forschung

LLM-Chain-of-Thought: Echtzeit-Überwachung für sichere Argumentationswege Moderne Sprachmodelle greifen zunehmend auf explizite „Chain-of-Thought“-Rechnungen zurück, um komplexe Aufgaben zu lösen. Während die Sicherheit von Inhalten – also das Vermeiden von schädlichen, voreingenommenen oder faktisch falschen Ausgaben – bereits intensiv untersucht wird, bleibt die Sicherheit des Denkprozesses selbst weitgehend unbeachtet. In einer neuen Studie wird dieser fehlende Aspekt als „Reasoning Safety“ definiert u

arXiv – cs.AI 27.03.2026 04:00

Forschung

SEVerA: Verifizierte Selbstentwickelnde Agenten sichern KI-Performance

In der KI-Forschung haben sich selbstentwickelnde Agenten als besonders leistungsfähig bei Aufgaben wie Programmreparatur und wissenschaftl…

arXiv – cs.LG 27.03.2026 04:00

Forschung

Trace2Skill: Automatisierte Skill‑Entwicklung für LLM‑Agenten

Die Entwicklung von domänenspezifischen Fähigkeiten für große Sprachmodelle (LLM) ist entscheidend, um komplexe Aufgaben zu bewältigen. Tra…

arXiv – cs.AI 27.03.2026 04:00

Forschung

Deep Reinforcement Learning steigert Kapazität und Kraftstoffeffizienz im gemischten Verkehr

Die Integration von automatisierten Fahrzeugen (AV) in den bestehenden Straßenverkehr, in dem sie mit von Menschen gesteuerten Fahrzeugen k…

arXiv – cs.AI 27.03.2026 04:00

Forschung

Frontier-LLMs: Sicherheitsrisiko – 95 % Fehlerrate bei schädlichen Inhalten

Eine aktuelle Veröffentlichung auf arXiv hat ein bislang wenig beachtetes Problem in den neuesten großen Sprachmodellen (LLMs) aufgedeckt…

arXiv – cs.AI 26.03.2026 04:00

Forschung

<p>LLM-Agenten als CFO? Benchmark prüft langfristige Ressourcenplanung</p> <p>Neues Forschungsprojekt zeigt, dass große Sprachmodelle zwar komplexe Aufgaben lösen können, aber bei der langfristigen Allokation knapper Ressourcen unter Unsicherheit noch stark hinter den Erwartungen zurückbleiben. Das von der Forschung entwickelte Benchmark‑System <em>EnterpriseArena</em> simuliert 132 Monate eines Unternehmens und kombiniert echte Finanzdaten, anonymisierte Geschäftsunterlagen, makroökonomische Signale sowie

arXiv – cs.AI 26.03.2026 04:00

Forschung

Effiziente Embedding-basierte Datengenerierung verbessert komplexe Aufgaben

Auf der Plattform arXiv wurde die neue Studie mit der Kennung 2603.22294v1 veröffentlicht, die einen bedeutenden Fortschritt im Bereich der…

arXiv – cs.LG 25.03.2026 04:00

Forschung

Chain-of-Authorization: LLMs übernehmen Autorisierungslogik

In der heutigen KI-Landschaft sind große Sprachmodelle (LLMs) unverzichtbare Denkmaschinen, die internes Wissen mit externen Kontexten verk…

arXiv – cs.AI 25.03.2026 04:00

Forschung

LLM-Agenten: Von statischen Vorlagen zu dynamischen Laufzeitgraphen

In den letzten Jahren haben große Sprachmodelle (LLMs) die Art und Weise, wie komplexe Aufgaben gelöst werden, grundlegend verändert. Durch…

arXiv – cs.AI 25.03.2026 04:00

Forschung

Agentische KI: Die nächste Intelligenzexplosion als gesellschaftliches Netzwerk

Die Vorstellung einer einzigen, allmächtigen KI – die sogenannte „Singularität“ – wird in der neuesten Forschung neu bewertet. Statt eines…

arXiv – cs.AI 24.03.2026 04:00

Praxis

Meta AI präsentiert Hyperagenten, die Lernregeln neu definieren

Meta AI hat kürzlich neue Hyperagenten vorgestellt, die nicht nur Aufgaben lösen, sondern auch ihre eigenen Lernregeln neu schreiben können…

MarkTechPost 24.03.2026 01:42

Forschung

MemReward: Graphbasierter Erfahrungsspeicher LLM-Belohnungen mit wenigen Labels

In der Welt der großen Sprachmodelle (LLMs) ist die Belohnungsoptimierung ein entscheidender Schritt, um komplexe Aufgaben wie mathematisch…

arXiv – cs.LG 23.03.2026 04:00

Forschung

MAPLE: Metadatenbasierte Sprachmodell-Entwicklung verbessert Datenschutz

Die Forschung zu künstlicher Intelligenz (KI) hat in den letzten Jahren enorme Fortschritte gemacht. Durch die Kombination von Machine Lear…

arXiv – cs.AI 23.03.2026 04:00

Forschung

GoAgent: Neue Topologie-Generierung für LLM-basierte Multi-Agenten

LLM-basierte Multi-Agenten-Systeme (MAS) haben gezeigt, dass sie komplexe Aufgaben mit bemerkenswerter Präzision lösen können. Ihre Leistun…

arXiv – cs.LG 23.03.2026 04:00

Praxis

NVIDIA stellt Nemotron-Cascade 2 vor: 30B MoE mit 3B aktiven Parametern

NVIDIA hat heute die Veröffentlichung von Nemotron-Cascade 2 bekannt gegeben – ein Open‑Weight Mixture‑of‑Experts (MoE) Modell mit 30 Milli…

MarkTechPost 20.03.2026 22:38

Forschung

DDPO: Reduziert Antwortlänge, steigert Genauigkeit bei großen Rechenmodellen

Große Rechenmodelle für logisches Denken zeigen beeindruckende Fähigkeiten, leiden jedoch häufig unter „Overthinking“. Dabei erzeugen sie u…

arXiv – cs.LG 20.03.2026 04:00

Forschung

MetaClaw: Agent, der sich selbst weiterentwickelt – kontinuierliches Meta‑Lernen

In der Welt der großen Sprachmodelle (LLMs) werden Agenten zunehmend für komplexe Aufgaben eingesetzt. Oft bleiben diese Agenten jedoch sta…

arXiv – cs.LG 19.03.2026 04:00

Forschung

<h1>Agentic SQL: Neue Belohnungsmechanismen lösen Sparse Feedback im Text‑zu‑SQL</h1> <p>Agentic Reinforcement Learning (RL) hat das Potenzial, komplexe Aufgaben zu meistern, doch im Bereich Text‑zu‑SQL bleibt die Anwendung bislang auf Einzelschritte beschränkt. Der Hauptgrund dafür ist das Credit‑Assignment‑Problem: In herkömmlichen Modellen wird die Belohnung ausschließlich anhand des Endergebnisses berechnet, wodurch die Zwischenschritte ignoriert werden und die Bewertung der Leistung unklar bleibt.</p>

arXiv – cs.AI 18.03.2026 04:00

Forschung

TERMINATOR: Optimale Abbruchpunkte für Chain-of-Thought-Modelle finden

Große Rechenmodelle für komplexe Aufgaben nutzen Chain-of-Thought (CoT), um Zwischenschritte zu generieren, bevor sie die endgültige Antwor…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Hierarchisches Meta-Reinforcement Learning: Mehrstufige MDP‑Kompression

In der heutigen Forschung zu künstlicher Intelligenz (KI) und maschinellem Lernen (ML) ist die Entwicklung von Algorithmen, die in der Lage…

arXiv – cs.LG 11.03.2026 04:00

Forschung

SCALAR: KI-gestützte Planung und Deep RL ermöglichen neue Lernmethoden

Mit dem neuen Framework SCALAR wird die Kluft zwischen hochrangiger Sprachplanung und niedrigstufiger Steuerung geschliffen. Durch die Komb…

arXiv – cs.LG 11.03.2026 04:00

Forschung

P^2GNN: Zwei Prototypensätze steigern Leistung von Graph Neural Networks

Graph Neural Networks, die auf Message Passing basieren, haben in den letzten Jahren große Aufmerksamkeit gewonnen, weil sie komplexe Aufga…

arXiv – cs.LG 11.03.2026 04:00

Aktuell

Nvidia plant Einführung einer Open-Source-Plattform für KI-Agenten

Nvidia bereitet vor seiner jährlichen Entwicklerkonferenz einen innovativen Softwareansatz vor, der KI-Agenten ähnlich wie OpenClaw einsetz…

Wired – AI (Latest) 09.03.2026 23:11

Forschung

SkillNet: KI‑Fähigkeiten systematisch bündeln und verbessern

KI‑Agenten können heute flexibel Werkzeuge anrufen und komplexe Aufgaben erledigen, doch ihr langfristiger Fortschritt bleibt durch das Feh…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EvoTool: Selbstoptimierung von Tool‑Nutzungsstrategien in LLM-Agenten

LLM‑basierte Agenten brauchen effektive Tool‑Nutzungsstrategien, um komplexe Aufgaben zu lösen. Die Optimierung dieser Strategien ist jedoc…

arXiv – cs.AI 06.03.2026 05:00

Aktuell

Echo Show 15: Nach einem Monat Test zeigt Alexa+ erhebliche Schwächen

Ich habe Amazons Echo Show 15 mit dem neuen Alexa+ KI-Assistenten für einen ganzen Monat in meiner Küche installiert, um seine Leistungsfäh…

Wired – AI (Latest) 06.03.2026 11:00

Praxis

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

OpenAI hat das neue Open‑Source-Framework Symphony vorgestellt, das die Koordination autonomer KI‑Coding‑Agenten über strukturierte „Implem…

MarkTechPost 05.03.2026 17:37

Forschung

RAPO: Erkundung von LLM-Agenten durch Retrieval‑gestützte Optimierung

Agentic Reinforcement Learning (Agentic RL) hat das Potenzial, große Sprachmodelle (LLM) zu leistungsstarken Agenten zu machen, die komplex…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

In einer wegweisenden Studie wird ein neues Paradigma für Robotik vorgestellt, das Roboter von passiven Ausführenden zu aktiven Information…

arXiv – cs.AI 04.03.2026 05:00

Finde Modelle, Firmen und Themen

openJiuwen Community präsentiert „JiuwenClaw“: KI-Agent für Aufgabenmanagement

SEVerA: Verifizierte Selbstentwickelnde Agenten sichern KI-Performance

Trace2Skill: Automatisierte Skill‑Entwicklung für LLM‑Agenten

Deep Reinforcement Learning steigert Kapazität und Kraftstoffeffizienz im gemischten Verkehr

Frontier-LLMs: Sicherheitsrisiko – 95 % Fehlerrate bei schädlichen Inhalten

Effiziente Embedding-basierte Datengenerierung verbessert komplexe Aufgaben

Chain-of-Authorization: LLMs übernehmen Autorisierungslogik

LLM-Agenten: Von statischen Vorlagen zu dynamischen Laufzeitgraphen

Agentische KI: Die nächste Intelligenzexplosion als gesellschaftliches Netzwerk

Meta AI präsentiert Hyperagenten, die Lernregeln neu definieren

MemReward: Graphbasierter Erfahrungsspeicher LLM-Belohnungen mit wenigen Labels

MAPLE: Metadatenbasierte Sprachmodell-Entwicklung verbessert Datenschutz

GoAgent: Neue Topologie-Generierung für LLM-basierte Multi-Agenten

NVIDIA stellt Nemotron-Cascade 2 vor: 30B MoE mit 3B aktiven Parametern

DDPO: Reduziert Antwortlänge, steigert Genauigkeit bei großen Rechenmodellen

MetaClaw: Agent, der sich selbst weiterentwickelt – kontinuierliches Meta‑Lernen

TERMINATOR: Optimale Abbruchpunkte für Chain-of-Thought-Modelle finden

Hierarchisches Meta-Reinforcement Learning: Mehrstufige MDP‑Kompression

SCALAR: KI-gestützte Planung und Deep RL ermöglichen neue Lernmethoden

P^2GNN: Zwei Prototypensätze steigern Leistung von Graph Neural Networks

Nvidia plant Einführung einer Open-Source-Plattform für KI-Agenten

SkillNet: KI‑Fähigkeiten systematisch bündeln und verbessern

EvoTool: Selbstoptimierung von Tool‑Nutzungsstrategien in LLM-Agenten

Echo Show 15: Nach einem Monat Test zeigt Alexa+ erhebliche Schwächen

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

RAPO: Erkundung von LLM-Agenten durch Retrieval‑gestützte Optimierung

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

🍪 Cookie-Einstellungen

Frontier-LLMs: Sicherheitsrisiko – 95 % Fehlerrate bei schädlichen Inhalten