Suche nach Demonstrationen

Neues Scouting-Tool nutzt Inverse Reinforcement Learning zur Spielerwahl im Esport

Traditionelle Esport-Scouting-Methoden beruhen stark auf manueller Videoanalyse und aggregierten Leistungskennzahlen, die oft die feinen En…

arXiv – cs.LG 17.04.2026 04:00

Forschung

LLM‑HYPER: KI‑basierte Hypernetworks revolutionieren Cold‑Start‑Ads

Ein neues Forschungsprojekt namens LLM‑HYPER hat die Art und Weise, wie Online‑Werbetreibende mit dem sogenannten Cold‑Start‑Problem umgehe…

arXiv – cs.AI 15.04.2026 04:00

Forschung

Aktives Imitation Learning erhöht Sicherheit bei LFM‑Inference auf 3D‑S-NUCA

Die Ausführung von Large Foundation Models (LFMs) erfordert enorme Speicher- und Rechenressourcen. Traditionell werden dafür GPUs eingesetz…

arXiv – cs.LG 15.04.2026 04:00

Forschung

LLMs als textbasierte Steuerung: Neue Benchmark für Exploration und Navigation

Forscher haben ein neues, reproduzierbares Benchmark entwickelt, um zu prüfen, ob große Sprachmodelle (LLMs) allein mit Textbefehlen in unb…

arXiv – cs.AI 14.04.2026 04:00

Forschung

GraphWalker: Graphbasiertes In-Context-Lernen steigert klinische EHR-Entscheidungen

Die Analyse von elektronischen Gesundheitsakten (EHRs) ist ein zentrales, aber komplexes Problem in der modernen Medizin. In-Context-Learni…

arXiv – cs.LG 09.04.2026 04:00

Forschung

Domänenübergreifende Beispiele steigern LLMs beim logischen Denken

Die neuesten Fortschritte von großen Sprachmodellen (LLMs) im logischen Denken sind beeindruckend, doch sie erreichen noch nicht die mensch…

arXiv – cs.AI 08.04.2026 04:00

Praxis

Gemini API: Google Search, Maps und eigene Funktionen in einem Aufruf kombinieren

Google hat im März 2026 die Gemini‑API um ein bahnbrechendes Feature erweitert: Entwickler können nun Google Search, Google Maps und eigene…

MarkTechPost 08.04.2026 01:56

Forschung

Querschnittliches Wissenstransfer in In-Context Learning: Erfolgreiche Studie

In der aktuellen Forschung zum In-Context Learning (ICL) wird häufig auf Demonstrationen aus dem gleichen Fachgebiet zurückgegriffen. Diese…

arXiv – cs.AI 08.04.2026 04:00

Forschung

Steuerbar, aber nicht dekodierbar: Funktionsvektoren jenseits der Logit‑Linse

In einer wegweisenden Studie, die auf arXiv veröffentlicht wurde, zeigen Forscher, dass Funktionsvektoren (FVs) große Sprachmodelle steuern…

arXiv – cs.LG 06.04.2026 04:00

Forschung

UI‑Oceanus: GUI-Agenten skalieren durch synthetische Umweltmodelle

Die neue Methode UI‑Oceanus löst ein langjähriges Problem bei der Skalierung von GUI‑Agenten: die Abhängigkeit von teuren menschlichen Demo…

arXiv – cs.AI 06.04.2026 04:00

Forschung

HALIDE: Hierarchisches Lernen aus unvollkommenen Demonstrationen mit Belohnungen

In einer wegweisenden Veröffentlichung stellt das Forschungsteam HALIDE vor – ein neues Verfahren, das Lernprozesse in E‑Learning‑Umgebunge…

arXiv – cs.LG 02.04.2026 04:00

Forschung

Neuer Ansatz: KI lernt, optimale visuelle Demonstrationen auszuwählen

Multimodale große Sprachmodelle (MLLMs) nutzen In‑Context‑Learning (ICL), um visuelle Aufgaben zu lösen. Dabei spielt die Qualität der Demo…

arXiv – cs.LG 31.03.2026 04:00

Forschung

<h1>Neues Verfahren: Präferenzbasiertes Lernen sicherer RL-Modelle</h1> <p>In der sicheren Verstärkungslern‑Forschung (Safe RL) gilt die Einhaltung von Sicherheitsbedingungen als entscheidend. In der Praxis sind diese Bedingungen jedoch oft komplex, subjektiv und schwer exakt zu formulieren. Traditionelle Methoden zur Ableitung von Constraints setzen auf starke Annahmen oder benötigen umfangreiche Expertendemonstrationen – beides ist in vielen Anwendungen unrealistisch.</p> <p>Eine vielversprechende Alter

arXiv – cs.LG 26.03.2026 04:00

Forschung

Neues Modell für in‑Kontext‑Zeitreihen: Vorhersagen ohne Feinabstimmung

Ein neues, auf Quantile‑Regression basierendes T5‑Encoder‑Decoder-Modell eröffnet die Möglichkeit, Zeitreihenvorhersagen und verwandte Aufg…

arXiv – cs.LG 25.03.2026 04:00

Forschung

Neue Theorie erklärt In-Context Learning mit CoT und Demonstrationen

Ein neues theoretisches Modell liefert erstmals ein klares Bild davon, wie In‑Context Learning (ICL) bei großen Sprachmodellen funktioniert…

arXiv – cs.LG 23.03.2026 04:00

Forschung

Autocurriculum: Training von Sprachmodellen für Chain-of-Thought-Reasoning optimiert

Chain-of-Thought-Reasoning, bei dem Sprachmodelle vor der Endantwort zusätzliche Denk‑Tokens erzeugen, hat die Leistungsfähigkeit von KI st…

arXiv – cs.LG 20.03.2026 04:00

Forschung

Neurosymbolische Technik verbessert Video-basierte Robotik-Programmierung um 31 %

Durch die jüngsten Fortschritte bei Vision‑Language‑Modellen (VLMs) können Roboter nun Video‑Demonstrationen interpretieren und daraus ausf…

arXiv – cs.AI 20.03.2026 04:00

Forschung

Neuer Modular Neural Computer: Algorithmen exakt mit externem Speicher ausführen

Ein neues Modell namens Modular Neural Computer (MNC) wurde auf arXiv veröffentlicht und verspricht, klassische Algorithmen exakt und deter…

arXiv – cs.LG 17.03.2026 04:00

Forschung

Mensch‑KI‑Team: Neue Proxy‑Modelle beschleunigen Materialforschung

In einem wegweisenden Ansatz arbeiten menschliche Experten und künstliche Intelligenz Hand in Hand, um die Entdeckung neuer Materialien zu…

arXiv – cs.LG 16.03.2026 04:00

Praxis

PyTorch begeistert bei NVIDIA GTC 2026 in San Jose – Jetzt mitmachen!

PyTorch wird vom 16. bis 19. März 2026 in San Jose bei der NVIDIA GTC vertreten. Entwickler aller Erfahrungsstufen sind eingeladen, an Live…

PyTorch – Blog 09.03.2026 20:19

Forschung

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

In der neuesten Studie von arXiv (2603.05829v1) wird die Testzeit-Anpassung von großen Sprachmodellen (LLMs) durch viele-Beispiel-Prompting…

arXiv – cs.LG 09.03.2026 04:00

Forschung

PRISM: Menschliche Anweisungen verfeinern Robotik‑Behauptungen – neue Methode

Ein neues Verfahren namens PRISM kombiniert die Stärken von Imitation Learning (IL) und Reinforcement Learning (RL), um Robotermanipulatio…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Neues Verfahren: Multimodales In-Context-Lernen mit Differenzierter Privatsphäre

Vision‑Language‑Modelle werden zunehmend in sensiblen Bereichen wie medizinischer Bildgebung und privaten Fotos eingesetzt. Bisher beschrän…

arXiv – cs.AI 06.03.2026 05:00

Forschung

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

In der jüngsten Forschung zum In‑Context‑Learning zeigen große Sprachmodelle, dass selbst ein einziges fehlerhaftes Beispiel in einer Demon…

arXiv – cs.LG 06.03.2026 05:00

Forschung

U-Parking: Autonomes Parksystem mit UWB und KI-gestützter Planung

Ein neues, hochmodernes Parksystem namens U‑Parking wurde vorgestellt, das die Vorteile von Ultra‑Wideband (UWB) und künstlicher Intelligen…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

In einer wegweisenden Studie wird ein neues Paradigma für Robotik vorgestellt, das Roboter von passiven Ausführenden zu aktiven Information…

arXiv – cs.AI 04.03.2026 05:00

Forschung

4‑Bit‑Attention mit Quantization‑Aware Training: Neue Methode Attn‑QAT

Die zuverlässige Umsetzung von 4‑Bit‑Attention ist ein entscheidender Schritt für die vollständige FP4‑Rechnung auf den neuesten FP4‑fähige…

arXiv – cs.LG 03.03.2026 05:00

Aktuell

AI‑Native Netzwerke: MWC 2026 beweist, dass sie Realität sind

Seit Jahren ist das Thema AI‑Native Netzwerke ein wiederkehrendes Gesprächsthema beim Mobile World Congress. Was MWC 2026 in Barcelona beso…

AI News (TechForge) 03.03.2026 08:00

Forschung

Sicherheitsorientiertes Q‑Learning: Expertenbeispiele bei unbekannten Beschränkungen In einer neuen Studie aus dem Bereich der künstlichen Intelligenz wird gezeigt, wie Agenten aus sicheren Demonstrationen lernen können, selbst in Umgebungen mit unbekannten Beschränkungen zu agieren. Das Ziel ist es, eine Politik zu entwickeln, die die Wahrscheinlichkeit von sicheren, aber gleichzeitig lohnenden Handlungen maximiert. Der Ansatz, der als SafeQIL (Sicheres Q‑Inverse Konstrahiertes Verstärkungslernen) bezeic

arXiv – cs.LG 02.03.2026 05:00

Forschung

MIMIC: Mit innerer Sprache steuert KI menschliches Verhalten

Die Koordination von Menschen und künstlicher Intelligenz erfordert Agenten, die menschliche Verhaltensweisen nachahmen und gleichzeitig fl…

arXiv – cs.AI 25.02.2026 05:00

Finde Modelle, Firmen und Themen

Neues Scouting-Tool nutzt Inverse Reinforcement Learning zur Spielerwahl im Esport

LLM‑HYPER: KI‑basierte Hypernetworks revolutionieren Cold‑Start‑Ads

Aktives Imitation Learning erhöht Sicherheit bei LFM‑Inference auf 3D‑S-NUCA

LLMs als textbasierte Steuerung: Neue Benchmark für Exploration und Navigation

GraphWalker: Graphbasiertes In-Context-Lernen steigert klinische EHR-Entscheidungen

Domänenübergreifende Beispiele steigern LLMs beim logischen Denken

Gemini API: Google Search, Maps und eigene Funktionen in einem Aufruf kombinieren

Querschnittliches Wissenstransfer in In-Context Learning: Erfolgreiche Studie

Steuerbar, aber nicht dekodierbar: Funktionsvektoren jenseits der Logit‑Linse

UI‑Oceanus: GUI-Agenten skalieren durch synthetische Umweltmodelle

HALIDE: Hierarchisches Lernen aus unvollkommenen Demonstrationen mit Belohnungen

Neuer Ansatz: KI lernt, optimale visuelle Demonstrationen auszuwählen

Neues Modell für in‑Kontext‑Zeitreihen: Vorhersagen ohne Feinabstimmung

Neue Theorie erklärt In-Context Learning mit CoT und Demonstrationen

Autocurriculum: Training von Sprachmodellen für Chain-of-Thought-Reasoning optimiert

Neurosymbolische Technik verbessert Video-basierte Robotik-Programmierung um 31 %

Neuer Modular Neural Computer: Algorithmen exakt mit externem Speicher ausführen

Mensch‑KI‑Team: Neue Proxy‑Modelle beschleunigen Materialforschung

PyTorch begeistert bei NVIDIA GTC 2026 in San Jose – Jetzt mitmachen!

Viele-Beispiel-Prompting: Testzeit-Anpassung von LLMs – Chancen & Grenzen

PRISM: Menschliche Anweisungen verfeinern Robotik‑Behauptungen – neue Methode

Neues Verfahren: Multimodales In-Context-Lernen mit Differenzierter Privatsphäre

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

U-Parking: Autonomes Parksystem mit UWB und KI-gestützter Planung

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

4‑Bit‑Attention mit Quantization‑Aware Training: Neue Methode Attn‑QAT

AI‑Native Netzwerke: MWC 2026 beweist, dass sie Realität sind

MIMIC: Mit innerer Sprache steuert KI menschliches Verhalten

🍪 Cookie-Einstellungen

Neurosymbolische Technik verbessert Video-basierte Robotik-Programmierung um 31 %

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

AI‑Native Netzwerke: MWC 2026 beweist, dass sie Realität sind