Alle Referenzen
Daten

Umfassende Verbesserung der Datenqualität

Validierung und Abgleich von Millionen Grundstücksdatensätzen über Behörden hinweg, damit eine Steuerbehörde auf verlässliche Daten bauen konnte.

2M+geprüfte Datensätze

Auf einen Blick

  • Bereich: Öffentlicher Sektor — Staatsfinanzen & Grundsteuer
  • Unsere Rolle: Wir haben die automatisierte Datenvalidierungsplattform konzipiert und entwickelt, die die Datensätze bereinigte
  • Zeitraum: Umgesetzt 2025

Die Herausforderung

Eine nationale Grundsteuerbehörde kann nur abrechnen, worauf sie sich verlassen kann — und auf ihre Daten konnte sie sich nicht verlassen. Ihre Datensätze mussten aus einem Wildwuchs unterschiedlichster Quellen zusammengetragen werden — Post-, Strom-, Wasser-, Karten- und Registersysteme — und keine zwei sprachen dieselbe Sprache. Jede brachte ihre eigenen Formate mit, ihren eigenen Detailgrad, sogar ihre eigenen Einheiten: Adressen als Freitext im einen System und strukturierte Felder im anderen, GPS-Koordinaten in inkompatiblen Schreibweisen, Namen ohne gemeinsame Konvention. Es gab keine verlässlichen Identifikatoren, um die Quellen zu verknüpfen, und die Formate hatten sich über die Jahre auseinanderentwickelt. Hinzu kam, dass die Datensätze voller Fehler steckten — fehlende oder fehlerhafte Eigentümeradressen, Grundstücke ohne identifizierbaren Eigentümer — und jeder Fehler bedeutete einen nicht zustellbaren Steuerbescheid oder nie abgerechnete Einnahmen. Das alles von Hand abzugleichen, über Millionen Datensätze aus einem Gewirr inkompatibler Quellen, war aussichtslos.

Der Ansatz

Wir haben eine automatisierte Datenvalidierungsplattform konzipiert und entwickelt, die Datensätze aus jeder Quelle einliest und sie zunächst vergleichbar macht — sie vereinheitlicht widersprüchliche Formate, gleicht Einheiten ab und bringt inkonsistente GPS-Koordinaten auf eine gemeinsame Referenz, bevor irgendetwas anderes geschieht. Erst dann gleicht sie die Datensätze mit autoritativen Post- und Registerdaten ab und lässt eine Regel-Engine über jeden Eigentümernamen und jede Adresse laufen. Jeder Datensatz wird klassifiziert und jeder Fehler kategorisiert — vom wiederherstellbaren fehlenden Bezirk bis zum Eigentümer, den es schlicht nicht gibt — und wo die Belege es zulassen, wird der Datensatz automatisch korrigiert und angereichert, statt an einen Menschen übergeben zu werden. Aus einer manuellen, einmaligen Bereinigung wurde ein wiederholbarer Ablauf, den die Behörde bei neuen Daten erneut ausführen konnte.

Das Ergebnis

Die Behörde wechselte von einem Register, das sie infrage stellte, zu einem, auf dessen Basis sie abrechnen konnte.

  • Über 2 Millionen Grundstücksdatensätze, aus einem Wildwuchs inkompatibler Quellsysteme stammend, validiert und zu einem einheitlichen Datensatz zusammengeführt
  • Über 500.000 Datensätze korrigiert oder angereichert — Adressen rekonstruiert, Eigentümer aufgelöst, ungültige Einträge abgefangen
  • Rund jeder vierte Datensatz enthielt einen Fehler, den der frühere Prozess übersehen hatte
  • Das Ergebnis: ein sauberer, benachrichtigungsfertiger Datensatz — und ein automatisierter Ablauf, um ihn so zu halten
Nächstes Projekt

Die Software hinter nationalen Ausweisdokumenten auf vier Kontinenten

Die Personalisierungs- und Ausgabesoftware hinter nationalen Ausweisdokumenten — Pässe, eID-Karten, Aufenthaltstitel — in Regierungsprogrammen auf vier Kontinenten.