KI News: Kurz und klar.

Anmelden

How Far are VLMs from Visual Spatial Intelligence? A Benchmark-Driven Perspective

arXiv – cs.AI • 24.09.2025 05:00 • Original

#Visuelle räumliche Vernunft #Vision-Language-Modelle #Embodied Intelligence #Autonome Systeme #Räumliche Intelligenz #SIBench #Mehransicht-Logik

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 05.11.2025 05:00

Ariadne: A Controllable Framework for Probing and Extending VLM Reasoning Boundaries

arXiv – cs.LG • 03.11.2025 05:00

ECVL-ROUTER: Scenario-Aware Routing for Vision-Language Models

arXiv – cs.AI • 27.10.2025 04:00

Learning Neural Control Barrier Functions from Expert Demonstrations using Inverse Constraint Learning

arXiv – cs.AI • 27.10.2025 04:00

Towards Reliable Code-as-Policies: A Neuro-Symbolic Framework for Embodied Task Planning

arXiv – cs.AI • 27.10.2025 04:00

A Multimodal Benchmark for Framing of Oil & Gas Advertising and Potential Greenwashing Detection

arXiv – cs.AI • 13.10.2025 05:00

Evaluating Hallucinations in Multimodal LLMs with Spoken Queries under Diverse Acoustic Conditions