Hoy en día, la respuesta de muchas empresas para acceder a datos para su uso analítico es construir un laberinto complejo de pipelines de datos. Estos pipelines recogen los datos de una o múltiples fuentes, los limpian, los transforman y los mueven a otra ubicación para su consumo. Este acercamiento al manejo de datos muchas veces deja a los pipelines consumidores con la difícil tarea de verificar la integridad de los datos entrantes y construir una lógica compleja para limpiar esos datos y permitir que lleguen al nivel requerido de calidad. El problema fundamental con esto es que la fuente no tiene ningún incentivo ni responsabilidad a la hora de proveer datos de calidad para sus consumidores. Por esta razón, abogamos por la integridad de los datos en su origen, lo cual quiere decir que cualquier fuente que provea datos consumibles debe describir explícitamente sus medidas para lograr la calidad y garantizar aquellas medidas. La razón principal detrás de esto es que los sistemas y equipos de origen son los más familiarizados con sus datos y los que están en mejor posición para arreglarlos en la fuente. La arquitectura Malla de datos lleva esto un paso más allá, comparando los datos consumibles a un producto, donde la calidad de estos y sus objetivos son atributos integrales de cada colección de datos compartida.