Kõik referentsid
Andmed

Andmekvaliteedi ulatuslik tõstmine

Miljonite kinnistukirjete valideerimine ja ühildamine eri ametkondade vahel, et maksuhaldur saaks tugineda usaldusväärsetele andmetele.

2M+kontrollitud kirjet

Ülevaade

  • Valdkond: Avalik sektor — riigirahandus ja kinnisvaramaks
  • Meie roll: Disainisime ja ehitasime automaatse andmevalideerimise platvormi, mis kirjed korda tegi
  • Ajaraam: Teostatud 2025

Väljakutse

Riiklik kinnisvaramaksu haldur saab maksustada vaid seda, mida ta usaldab — ja oma andmeid ta usaldada ei saanud. Kirjed tuli koondada hulgast erinevatest allikatest — posti-, elektri-, vee-, kaardi- ja registrisüsteemidest — ning ükski neist ei rääkinud sama keelt. Igaühel oli oma formaat, oma detailsusaste, isegi oma ühikud: aadressid ühes süsteemis vaba tekstina ja teises struktureeritud väljadena, GPS-koordinaadid omavahel sobimatutes esitustes, nimed ilma ühtse konventsioonita. Allikate sidumiseks puudusid usaldusväärsed identifikaatorid ja formaadid olid aastatega lahknenud. Lisaks oli kirjetes hulgaliselt vigu — puuduvad või vigased omaniku aadressid, kinnistud ilma tuvastatava omanikuta — ning iga viga tähendas kättetoimetamata maksuteadet või arveldamata jäänud tulu. Selle käsitsi korrastamine miljonite kirjete ja segase allikate rägastiku ulatuses oli lootusetu.

Lahendus

Disainisime ja ehitasime automaatse andmevalideerimise platvormi, mis loeb sisse kirjed igast allikast ja muudab need esmalt võrreldavaks — ühtlustades vastuolulised formaadid, viies kokku ühikud ning tuues erinevad GPS-koordinaadid ühisele alusele, enne kui midagi muud tehakse. Alles seejärel ühildatakse kirjed autoriteetsete posti- ja registriandmetega ning iga omaniku nime ja aadressi kontrollib reeglimootor. Iga kirje klassifitseeritakse ja iga viga liigitatakse — taastatavast puuduvast piirkonnast kuni omanikuni, keda lihtsalt ei eksisteeri — ning kus tõendid lubavad, parandatakse ja rikastatakse kirje automaatselt, mitte ei anta inimese kätte. Varasemast käsitsi tehtud ühekordsest korrastusest sai korratav töövoog, mida haldur sai uute andmete saabudes uuesti käivitada.

Tulemus

Haldur liikus registrist, mida ta kahtluse alla seadis, registrini, mille põhjal sai maksustada.

  • Üle 2 miljoni kinnistukirje, mis pärinesid segasest erinevate alliksüsteemide hulgast, valideeriti ja ühildati üheks sidusaks andmestikuks
  • Üle 500 000 kirje parandati või rikastati — aadressid taastati, omanikud tuvastati, vigased kirjed püüti kinni
  • Ligikaudu iga neljas kirje sisaldas viga, mille senine protsess oli kahe silma vahele jätnud
  • Tulemus: puhas, maksuteateks valmis andmestik — ja automaatne töövoog selle hoidmiseks
Järgmine projekt

Tarkvara riiklike ID-dokumentide taga neljal mandril

Personaliseerimis- ja väljastustarkvara riiklike ID-dokumentide taga — passid, eID-kaardid, elamisload — riiklikes programmides neljal mandril.