Canada Spends: Wie Build Canada Regierungsfinanzen transparent macht

Simon Willison – Blog Original ≈2 Min. Lesezeit
Anzeige

Build Canada, ein freiwillig betriebenes Non-Profit, hat im Februar 2025 die Initiative Canada Spends ins Leben gerufen, um die finanziellen Daten der kanadischen Regierung für jedermann zugänglich und durchsuchbar zu machen. Das Projekt kombiniert moderne Open‑Source‑Technologien wie Datasette, Ruby‑Skripte, sqlite‑utils und KI‑gestützte PDF‑Extraktion, um die komplexen Finanzberichte der Behörden in ein nutzerfreundliches Format zu überführen.

In einem ausführlichen Gespräch mit Brendan Samek, dem Hauptarchitekten hinter Canada Spends, wurde erklärt, wie die Plattform Daten aus über zwei Millionen Zeilen sammelt und in einer denormalisierten Kopie speichert, die über einen leistungsfähigen Suchindex verfügt. Die Daten werden auf api.canadasbilding.com gehostet und ermöglichen es Anwendern, gezielt nach Ausgaben, Verträgen und Steuereinnahmen zu filtern.

Ein besonderer Fokus liegt auf der Verarbeitung von PDF‑Berichten, die die offiziellen Finanzdaten enthalten. Durch Ruby‑Ingestionsskripte und sqlite‑utils werden die PDFs zunächst in strukturierte Tabellen umgewandelt. Anschließend kommt die KI‑Anwendung Gemini zum Einsatz, um fehlende Felder zu ergänzen und die Datenqualität zu erhöhen. Diese Kombination aus manueller und KI‑gestützter Extraktion reduziert Fehlerquellen und beschleunigt die Datenbereitstellung erheblich.

Samek betonte die Bedeutung von SQLite als leichtgewichtiges, portables Format für die Verteilung der Daten. Durch die Nutzung von SQLite können Entwickler und Analysten die Daten lokal speichern, ohne auf komplexe Datenbankinfrastrukturen angewiesen zu sein. Dies erleichtert die Integration in bestehende Analyse‑Tools und fördert die Verbreitung der Plattform in der Community.

Die Plattform bietet nicht nur eine Suchfunktion, sondern auch einen visuellen „Tax Sources and Sinks“-Viewer, der die Herkunft und Verwendung von Steuergeldern anschaulich darstellt. Zusätzlich gibt es eine Datenbank mit Regierungsverträgen, die über verschiedene Ebenen der kanadischen Verwaltung hinweg durchsucht werden kann. Diese umfassende Sichtweise unterstützt Transparenz, Rechenschaftspflicht und die Förderung von Innovationen im öffentlichen Sektor.

Ähnliche Artikel