Effiziente Punktwolken‑Segmentierung für unverbesserte Straßen mit 50 Daten
In einer neuen Studie wird ein daten‑effizienter Pipeline-Ansatz vorgestellt, der die semantische Segmentierung von unverbesserte Straßen und sieben weiteren Klassen mit nur 50 gelabelten Punktwolken ermöglicht. Der Ansatz nutzt ein zweistufiges Trainingsverfahren: Zunächst wird ein projektionbasiertes Convolutional Neural Network auf einer Mischung aus öffentlichen städtischen Datensätzen und einem kleinen, sorgfältig kuratierten In‑Domain‑Datensatz vortrainiert. Anschließend wird ein leichtgewichtiges Vorhersage‑Head ausschließlich auf In‑Domain‑Daten fein‑justiert.
Die Autoren untersuchen zudem die Anwendung von Point Prompt Training auf Batch‑Normalization‑Schichten, die Wirkung von Manifold Mixup als Regularisierer sowie die Einbindung histogram‑normalisierter Ambients, um die Leistung weiter zu steigern. Durch die Kombination dieser Techniken verbessert sich die durchschnittliche Intersection‑over‑Union (mIoU) von 33,5 % auf 51,8 % und die Gesamt‑Genauigkeit von 85,5 % auf 90,8 %, wenn man sie mit einem naiven In‑Domain‑Training vergleicht.
Die Ergebnisse zeigen deutlich, dass das Vor‑Training über mehrere Datensätze entscheidend für die Generalisierung ist und robuste Segmentierung bei begrenzter In‑Domain‑Supervision ermöglicht. Insgesamt liefert die Studie ein praxisnahes Framework für 3D‑semantische Segmentierung in herausfordernden, datenarmen Szenarien. Der zugehörige Code ist auf GitHub verfügbar: https://github.com/andrewyarovoi/MD-FRNet.