Vielversprechende VLMs verlieren visuelle Basis – neues Paper zeigt Risiko
Eine aktuelle Studie auf arXiv beleuchtet ein bislang wenig beachtetes Phänomen bei multimodalen Sprach‑ und Bildmodellen (VLMs): Während die Modelle im Laufe des Denkprozesses immer präziser werden, verlieren sie zuneh…