DISCO: Browserbasiertes, datenschutzfreundliches Framework für kollaboratives Lernen
In einer Welt, in der sensible Daten häufig aus Datenschutz-, Urheberrechts- und rechtlichen Gründen nicht geteilt werden dürfen, erschwert das die Entwicklung leistungsfähiger Vorhersagemodelle und führt zu einer ungleichen Verteilung von Genauigkeit. DISCO – kurz für DIStributed COllaborative learning – bietet hier eine Lösung: ein quelloffenes, browserbasiertes Tool, das es Anwendern ohne Programmierkenntnisse ermöglicht, gemeinsam Machine‑Learning‑Modelle zu trainieren, ohne jemals die Originaldaten zu teilen.
Die Webanwendung von DISCO führt das Training direkt im Browser aus, wodurch sie sofort auf allen Plattformen – inklusive Smartphones – einsatzbereit ist. Durch ein modular aufgebautes System kann zwischen federated und dezentralen Lernparadigmen gewählt werden, verschiedene Datenschutz‑Stufen aktiviert und unterschiedliche Gewichtungsstrategien für die Aggregation der Modelle eingesetzt werden. Diese Flexibilität erlaubt es, Modelle zu personalisieren und gleichzeitig Bias‑Resilienz zu gewährleisten.
Der Quellcode steht auf GitHub zur Verfügung (https://github.com/epfml/disco) und ein interaktives Demo‑Interface kann unter https://discolab.ai ausprobiert werden.