Forschung
ICPRL: VLMs lernen physikalische Intuition durch interaktive Kontrolle
Vision‑Language‑Modelle (VLMs) sind bislang vor allem bei statischer Bildanalyse stark, doch sie stoßen an ihre Grenzen, wenn es um interak…
arXiv – cs.LG