Marquez es un proyecto de código abierto relativamente nuevo para recolectar y servir información de metadatos sobre un ecosistema de datos. Marquez representa un modelo de datos simple para capturar metadatos como el linaje, las tareas de procesamiento ascendentes y descendentes de los datos y su estado de ejecución, y un conjunto flexible de etiquetas para capturar los atributos de los conjuntos de datos. Provee un API RESTful simple para gestionar los metadatos, que simplifica la integración de Marquez con otras herramientas dentro del ecosistema de datos.
Hemos usado Marquez como punto de partida y lo hemos extendido para que se adapte a nuestras necesidades, como aplicar políticas de seguridad, y hemos hecho cambios a su lenguaje de dominio. Si estás buscando una herramienta pequeña y simple para comenzar con el almacenamiento y la visualización de tus tareas de procesamiento de datos y conjuntos de datos, Marquez está bien para empezar.