Suche nach Dateien | meineki.news

WiseOWL: Neue Methode zur Bewertung von Ontologien für Wiederverwendung

Die neue Methode WiseOWL liefert ein systematisches Verfahren zur Auswahl von Ontologien, die für die Wiederverwendung geeignet sind. Durch…

arXiv – cs.AI 15.04.2026 04:00

Praxis

NVIDIA & UMD stellen Audio-Flamingo-Next vor – offenes, leistungsstarkes Modell

NVIDIA in Zusammenarbeit mit Forschern der University of Maryland hat das neue Audio-Flamingo-Next (AF‑Next) vorgestellt, ein großes, offen…

MarkTechPost 14.04.2026 08:24

Forschung

SAGE: Neuer Benchmark für Service-Agenten mit Graph-basierter Bewertung

Die rasante Entwicklung großer Sprachmodelle (LLMs) hat die Automatisierung im Kundenservice vorangetrieben, doch die Bewertung ihrer Leist…

arXiv – cs.AI 13.04.2026 04:00

Aktuell

Leaked SteamGPT-Dateien: Wie KI die Moderation auf Steam verändern könnte

Die kürzlich veröffentlichten Leaks von SteamGPT haben die Gaming-Community in Aufruhr versetzt. In den gestohlenen Dateien ist ein interne…

Ars Technica – AI 10.04.2026 16:32

Praxis

Anthropic startet Project Glasswing: Claude Mythos nur für Sicherheitsforscher

Anthropic hat heute das neueste Modell Claude Mythos nicht öffentlich freigegeben, sondern nur einer sehr kleinen Gruppe von Preview-Partne…

Simon Willison – Blog 07.04.2026 20:52

Forschung

<h1>AgentHazard: Benchmark enthüllt Schwachstellen autonomer Computeragenten</h1> <p>Ein neues Benchmark namens AgentHazard wurde entwickelt, um die Gefahr von schädlichem Verhalten bei Computer‑Use‑Agenten zu untersuchen. Diese Agenten bauen auf Sprachmodellen auf, übernehmen jedoch die Fähigkeit, über Tools, Dateien und Ausführungsumgebungen hinweg persistente Aktionen auszuführen. Im Gegensatz zu herkömmlichen Chat‑Systemen behalten sie ihren Zustand über mehrere Interaktionen hinweg bei und wandeln Zwis

arXiv – cs.AI 06.04.2026 04:00

Forschung

HippoCamp: Benchmark für multimodale Dateiverwaltung auf dem PC

Mit HippoCamp wird die Leistungsfähigkeit von Agenten in der multimodalen Dateiverwaltung neu definiert. Im Gegensatz zu bisherigen Benchma…

arXiv – cs.AI 02.04.2026 04:00

Forschung

SimMOF: KI-Agent automatisiert MOF‑Simulationen von der Anfrage bis zum Ergebnis

Metal‑organische Rahmenwerke (MOFs) bieten ein riesiges Design‑Spektrum, und die Vorhersage ihrer strukturellen sowie physikochemischen Eig…

arXiv – cs.AI 01.04.2026 04:00

Forschung

JSON‑LD integriert Bildherkunft direkt in Computer‑Vision‑Datensätze

In der heutigen Bildverarbeitungsindustrie wird die Herkunft von Bilddaten immer wichtiger. Ein klar dokumentierter Ursprung hilft, Änderun…

arXiv – cs.LG 31.03.2026 04:00

Forschung

ReCUBE: Benchmark prüft, wie LLMs Repository‑Kontext nutzen

In der jüngsten Veröffentlichung auf arXiv (2603.25770v1) wird ein neues Benchmark namens ReCUBE vorgestellt, das speziell darauf abzielt…

arXiv – cs.AI 30.03.2026 04:00

Praxis

Agent-Infra präsentiert AIO Sandbox – Alles-in-einem Laufzeitumgebung für KI-Agenten

In der Entwicklung autonomer Agenten verschiebt sich der technische Engpass von der Modelllogik zum Ausführungsumfeld. Während große Sprach…

MarkTechPost 30.03.2026 00:04

Forschung

AutoSAM: KI-gestützte Automatisierung von SAM-Input-Dateien

In der Planung und Sicherheitsanalyse moderner Reaktoren bleibt das Erstellen von Input‑Dateien für das System Analysis Module (SAM) ein au…

arXiv – cs.AI 27.03.2026 04:00

Forschung

<h1>LLM-Agenten vs klassische HPO: Hybrid‑Centaur triumphiert</h1> <p>Eine neue Studie aus dem arXiv‑Repository <em>autoresearch</em> untersucht, ob große Sprachmodelle (LLMs) die klassischen Hyperparameter‑Optimierungsalgorithmen (HPO) übertreffen können. Dabei wird ein LLM-Agent eingesetzt, der die Trainingscode‑Dateien direkt bearbeitet, um optimale Hyperparameter‑Konfigurationen zu finden.</p> <p>Im Vergleich zu etablierten Verfahren wie CMA‑ES und TPE zeigen klassische HPO‑Methoden in einem fest defini

arXiv – cs.LG 27.03.2026 04:00

Aktuell

Claude übernimmt meinen Mac – einwandfrei, nur zwei kleine Stolpersteine

Claude kann jetzt den Bildschirm Ihres Macs übernehmen, um Aufgaben wie das Suchen von Dateien oder das Verfassen von E‑Mails zu erledigen…

ZDNet – Artificial Intelligence 26.03.2026 12:35

Aktuell

Finanzmanager setzen multimodale KI ein, um komplexe Workflows zu automatisieren

In der Finanzwelt beschleunigen Führungskräfte ihre Prozesse, indem sie moderne multimodale KI-Frameworks einsetzen. Diese Technologie ermö…

AI News (TechForge) 24.03.2026 17:03

Forschung

AutoMOOSE: KI-gesteuerte Phase‑Field‑Simulation ohne Fachkenntnisse

AutoMOOSE ist ein völlig neues, quelloffenes Framework, das die komplette Lebensdauer einer Phase‑Field‑Simulation aus einem einzigen, natü…

arXiv – cs.AI 24.03.2026 04:00

Aktuell

ChatGPT erhält Bibliothek für alle Dateien – so funktioniert es

ChatGPT hat jetzt eine Bibliothek für alle Dateien – ein bedeutender Schritt, der die KI näher an einen echten Arbeitsbereich bringt.

ZDNet – Artificial Intelligence 24.03.2026 17:21

Produkt

NVIDIA OpenShell macht autonome KI-Agenten sicherer – Design für Schutz

Autonome KI-Agenten stellen einen Wendepunkt in der künstlichen Intelligenz dar. Sie beschränken sich nicht mehr nur auf das Generieren von…

NVIDIA – Blog 23.03.2026 15:00

Aktuell

Verlag zieht Horrorroman zurück, Autor bestreitet KI‑Nutzung

Der Verlag hat die Veröffentlichung eines Horrorromans aus dem Verkauf genommen, nachdem mehrere Leser und Kritiker behaupteten, der Text s…

Ars Technica – AI 20.03.2026 21:03

Forschung

Memento‑Skills: Agenten, die Agenten bauen

Die neueste Veröffentlichung von Memento‑Skills präsentiert ein generisches, kontinuierlich lernendes LLM‑Agentensystem, das sich selbst zu…

arXiv – cs.AI 20.03.2026 04:00

Forschung

AgentFactory: Selbstlernende Agenten speichern Lösungen als ausführbaren Code

Die Entwicklung von Agenten, die auf großen Sprachmodellen (LLMs) basieren, gewinnt immer mehr an Bedeutung. Bisherige Ansätze zur Selbsten…

arXiv – cs.AI 19.03.2026 04:00

Forschung

Neues Verfahren: Verborgene Agenten‑Spuren aus Text extrahieren

In einem brandneuen Beitrag auf arXiv wird ein innovatives Verfahren vorgestellt, das die Nachverfolgung von Agenten in mehragentigen Sprac…

arXiv – cs.AI 19.03.2026 04:00

Forschung

MWP: Mit Ordnerstruktur statt komplexer Agenten-Frameworks neue AI-Orchestrierung

Die neue Methode Model Workspace Protocol (MWP) ersetzt herkömmliche Multi-Agent-Frameworks durch eine einfache Ordnerstruktur, um AI-Agent…

arXiv – cs.AI 18.03.2026 04:00

Forschung

vla-eval: Einheitliches Evaluations-Framework für VLA‑Modelle

Die neue Open‑Source-Plattform vla-eval revolutioniert die Bewertung von Vision‑Language‑Action‑Modellen. Durch die Trennung von Modellinfe…

arXiv – cs.AI 17.03.2026 04:00

Forschung

FinSheet-Bench: LLMs scheitern an komplexen Finanz-Tabellen – Benchmark

Ein neues Benchmark-Set namens FinSheet-Bench wurde vorgestellt, um die Leistungsfähigkeit von Large Language Models (LLMs) bei der Analyse…

arXiv – cs.AI 10.03.2026 04:00

Forschung

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

Der neue KI-Agent MOOSEnger richtet sich speziell an Anwender des Multiphysics Object‑Oriented Simulation Environment (MOOSE). Durch einen…

arXiv – cs.AI 06.03.2026 05:00

Forschung

SpatialText: Text-basiertes Benchmark für räumliches Verständnis großer Modelle

Die 3D-Visualisierung von Gebäuden ist ein wichtiger Bestandteil der Architektur und des Bauwesens. Sie ermöglicht es Architekten, Ingenieu…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neues Tool UMPIRE verbessert Unsicherheitsmessung bei multimodalen Sprachmodellen

Multimodale Large Language Models (MLLMs) können zwar beeindruckende Ergebnisse liefern, aber sie erzeugen oft plausible, aber fehlerhafte…

arXiv – cs.AI 02.03.2026 05:00

Forschung

KI-Agenten revolutionieren Sozialforschung: Können sie Wissenschaftler ersetzen?<p>In der neuesten Veröffentlichung auf arXiv wird beschrieben, wie KI-Agenten – Systeme, die mehrstufige Denkprozesse mit dauerhaftem Speicher, Tool-Zugriff und fachspezifischen Fähigkeiten ausführen – die Sozialforschung grundlegend verändern. Im Gegensatz zu herkömmlichen Chatbots, die nur auf einzelne Anfragen reagieren, können diese Agenten Dateien lesen, Code ausführen, Datenbanken abfragen, das Web durchsuchen und domänen

arXiv – cs.AI 27.02.2026 05:00

Forschung

MolFM-Lite: Mehrdimensionales Molekülmodell steigert Vorhersagegenauigkeit um 11 %

Ein neues Modell namens MolFM-Lite kombiniert drei unterschiedliche Darstellungen von Molekülen – die 1‑D‑Sequenz in SELFIES, die 2‑D‑Graph…

arXiv – cs.LG 27.02.2026 05:00

Finde Modelle, Firmen und Themen

WiseOWL: Neue Methode zur Bewertung von Ontologien für Wiederverwendung

NVIDIA & UMD stellen Audio-Flamingo-Next vor – offenes, leistungsstarkes Modell

SAGE: Neuer Benchmark für Service-Agenten mit Graph-basierter Bewertung

Leaked SteamGPT-Dateien: Wie KI die Moderation auf Steam verändern könnte

Anthropic startet Project Glasswing: Claude Mythos nur für Sicherheitsforscher

HippoCamp: Benchmark für multimodale Dateiverwaltung auf dem PC

SimMOF: KI-Agent automatisiert MOF‑Simulationen von der Anfrage bis zum Ergebnis

JSON‑LD integriert Bildherkunft direkt in Computer‑Vision‑Datensätze

ReCUBE: Benchmark prüft, wie LLMs Repository‑Kontext nutzen

Agent-Infra präsentiert AIO Sandbox – Alles-in-einem Laufzeitumgebung für KI-Agenten

AutoSAM: KI-gestützte Automatisierung von SAM-Input-Dateien

Claude übernimmt meinen Mac – einwandfrei, nur zwei kleine Stolpersteine

Finanzmanager setzen multimodale KI ein, um komplexe Workflows zu automatisieren

AutoMOOSE: KI-gesteuerte Phase‑Field‑Simulation ohne Fachkenntnisse

ChatGPT erhält Bibliothek für alle Dateien – so funktioniert es

NVIDIA OpenShell macht autonome KI-Agenten sicherer – Design für Schutz

Verlag zieht Horrorroman zurück, Autor bestreitet KI‑Nutzung

Memento‑Skills: Agenten, die Agenten bauen

AgentFactory: Selbstlernende Agenten speichern Lösungen als ausführbaren Code

Neues Verfahren: Verborgene Agenten‑Spuren aus Text extrahieren

MWP: Mit Ordnerstruktur statt komplexer Agenten-Frameworks neue AI-Orchestrierung

vla-eval: Einheitliches Evaluations-Framework für VLA‑Modelle

FinSheet-Bench: LLMs scheitern an komplexen Finanz-Tabellen – Benchmark

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

SpatialText: Text-basiertes Benchmark für räumliches Verständnis großer Modelle

Neues Tool UMPIRE verbessert Unsicherheitsmessung bei multimodalen Sprachmodellen

MolFM-Lite: Mehrdimensionales Molekülmodell steigert Vorhersagegenauigkeit um 11 %

🍪 Cookie-Einstellungen

MolFM-Lite: Mehrdimensionales Molekülmodell steigert Vorhersagegenauigkeit um 11 %