Neues KI-Modell verwandelt Fotos in erkundbare 3D-Welten – mit Einschränkungen
Anzeige
Ein öffentlich zugängliches KI-Tool kann aus einzelnen Fotos ein steuerbares, 3D-ähnliches Video erzeugen. Die Technologie nutzt fortschrittliche Bild‑zu‑Video‑Transformationen, die es ermöglichen, die Szene aus verschiedenen Blickwinkeln zu erkunden.
Allerdings ist die Verarbeitung sehr rechenintensiv und erfordert eine leistungsstarke GPU, um die Ergebnisse in Echtzeit zu generieren. Trotz dieser Hardwareanforderung eröffnet das Modell neue Möglichkeiten für die Erstellung immersiver Inhalte aus einfachen Fotomaterialien.
Ähnliche Artikel
KDnuggets
•
vLLM: Schnellere und einfachere Bereitstellung großer Sprachmodelle
The Register – Headlines
•
Nvidia präsentiert Jetson Thor: Mehr Rechenleistung für humanoide Robotik
The Register – Headlines
•
Cloud-Anbieter bieten OpenClaw als Service trotz Sicherheitswarnungen an
PyTorch – Blog
•
PyTorch-Team präsentiert Helion: Domain‑spezifische Sprache für portable Kernels
arXiv – cs.AI
•
FastAPI vs. Triton: Benchmark für sichere, skalierbare KI-Infereenzen
arXiv – cs.LG
•
VoxServe: Revolutionäres Streaming-System für Sprachmodelle