Menú
Técnicas

Integridad de datos en el origen

NOT ON THE CURRENT EDITION
This blip is not on the current edition of the radar. If it was on one of the last few editions it is likely that it is still relevant. If the blip is older it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the radarUnderstand more
Nov 2019
Adoptar?

Hoy en día, la respuesta de muchas empresas para acceder a datos para su uso analítico es construir un laberinto complejo de pipelines de datos. Estos pipelines recogen los datos de una o múltiples fuentes, los limpian, los transforman y los mueven a otra ubicación para su consumo. Este acercamiento al manejo de datos muchas veces deja a los pipelines consumidores con la difícil tarea de verificar la integridad de los datos entrantes y construir una lógica compleja para limpiar esos datos y permitir que lleguen al nivel requerido de calidad. El problema fundamental con esto es que la fuente no tiene ningún incentivo ni responsabilidad a la hora de proveer datos de calidad para sus consumidores. Por esta razón, abogamos por la integridad de los datos en su origen, lo cual quiere decir que cualquier fuente que provea datos consumibles debe describir explícitamente sus medidas para lograr la calidad y garantizar aquellas medidas. La razón principal detrás de esto es que los sistemas y equipos de origen son los más familiarizados con sus datos y los que están en mejor posición para arreglarlos en la fuente. La arquitectura Malla de datos lleva esto un paso más allá, comparando los datos consumibles a un producto, donde la calidad de estos y sus objetivos son atributos integrales de cada colección de datos compartida.