Kausale Logik ermöglicht kontrollierte 3D-Scene-Generierung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die neueste Veröffentlichung auf arXiv (2509.15249v1) stellt CausalStruct vor, ein innovatives Framework, das kausales Denken in die 3D-Scene-Generierung integriert. Durch die Nutzung großer Sprachmodelle werden kausale Graphen erstellt, in denen Objekte und deren Attribute als Knoten und die kausalen Abhängigkeiten sowie physikalischen Einschränkungen als Kanten dargestellt werden.

CausalStruct verbessert die Szene schrittweise, indem es die Reihenfolge der Objektplatzierung anhand kausaler Ordnung bestimmt und kausale Interventionen einsetzt, um die räumliche Anordnung an physikalische Vorgaben anzupassen. So bleibt die generierte Szene stets konsistent mit der Textbeschreibung und realistischen Dynamiken.

Der verfeinerte kausale Graph dient anschließend als Grundlage für weitere Optimierungsschritte. Ein PID-Regler (Proportional-Integral-Derivative) justiert iterativ die Größen und Positionen der Objekte, während 3D-Gaussian-Splatting und Score Distillation Sampling die Formgenauigkeit und Renderstabilität erhöhen.

Umfangreiche Experimente zeigen, dass CausalStruct 3D-Szenen mit verbesserter logischer Kohärenz, realistischen räumlichen Interaktionen und robuster Anpassungsfähigkeit erzeugt. Das System nutzt Texte oder Bilder als Leitfaden für die Platzierung und Anordnung von Objekten in 3D-Umgebungen.

Ähnliche Artikel