Todos los casos
Datos

Mejora masiva de la calidad de datos

Validación y conciliación de millones de registros de propiedad entre organismos para que una autoridad fiscal pudiera facturar con datos fiables.

2M+registros validados

De un vistazo

  • Sector: Sector público — finanzas públicas e impuesto sobre la propiedad
  • Nuestro papel: Diseñamos y construimos la plataforma automatizada de validación de datos que depuró los registros
  • Periodo: Ejecutado en 2025

El desafío

Una autoridad nacional del impuesto sobre la propiedad solo puede facturar lo que es capaz de fiar — y no podía fiarse de sus datos. Sus registros había que reunirlos a partir de una maraña de fuentes dispares —sistemas postales, eléctricos, de agua, cartográficos y registrales— y ninguno hablaba el mismo idioma. Cada uno traía sus propios formatos, su propio nivel de detalle, incluso sus propias unidades: direcciones como texto libre en un sistema y campos estructurados en otro, coordenadas GPS en notaciones incompatibles, nombres sin convención común. No había identificadores fiables para enlazar las fuentes y los formatos se habían distanciado con los años. Además, los registros estaban plagados de fallos —direcciones de propietario ausentes o mal formadas, propiedades sin propietario identificable— y cada fallo significaba un aviso fiscal que no se podía entregar o ingresos que nunca se facturaban. Reconciliarlo a mano, a lo largo de millones de registros extraídos de un enredo de fuentes incompatibles, era inviable.

El enfoque

Diseñamos y construimos una plataforma automatizada de validación de datos que ingiere registros de cada fuente y primero los hace comparables: normaliza formatos discordantes, reconcilia unidades y lleva las coordenadas GPS inconsistentes a una referencia común antes que nada. Solo entonces concilia los registros con datos postales y registrales autorizados y aplica un motor de reglas a cada nombre y dirección de propietario. Cada registro se clasifica y cada fallo se categoriza —desde un distrito ausente recuperable hasta un propietario que simplemente no existe— y, cuando la evidencia lo permite, el registro se corrige y enriquece de forma automática en lugar de pasarlo a una persona. Lo que había sido una limpieza manual y puntual se convirtió en un proceso repetible que la autoridad podía volver a ejecutar a medida que llegaban nuevos datos.

El resultado

La autoridad pasó de un registro que ponía en duda a uno con el que podía facturar.

  • Más de 2 millones de registros de propiedad, procedentes de un sinfín de sistemas de origen incompatibles, validados y conciliados en un único conjunto de datos coherente
  • Más de 500.000 registros corregidos o enriquecidos: direcciones reconstruidas, propietarios resueltos, entradas inválidas detectadas
  • Aproximadamente uno de cada cuatro registros contenía un error que el proceso anterior había pasado por alto
  • El resultado: un conjunto de datos limpio y listo para notificaciones, y un proceso automatizado para mantenerlo así
Siguiente proyecto

El software tras los documentos de identidad nacionales en cuatro continentes

El software de personalización y emisión tras los documentos de identidad nacionales —pasaportes, tarjetas eID, permisos de residencia— en programas gubernamentales de cuatro continentes.