Neue Studie zeigt, wie Modality Gap in medizinischen VLMs optimiert werden kann
Vision‑Language‑Modelle (VLMs) weisen einen charakteristischen „Cone‑Effekt“ auf, bei dem nichtlineare Encoder die Embeddings in stark konzentrierte Bereiche des Repräsentationsraums abbilden. Dieser Effekt führt zu ein…