Databricks Unity Catalog é uma solução de governança de dados para ativos como arquivos, tabelas ou modelos de aprendizado de máquina em um lakehouse. É uma versão gerenciada do Unity Catalog de código aberto que pode ser usada para governar e consultar dados mantidos em armazenamentos externos ou sob gerenciamento do Databricks. No passado, nossas equipes trabalharam com uma variedade de soluções de gerenciamento de dados, como Hive metastore ou Microsoft Purview. No entanto, o suporte combinado do Unity Catalog para governança, gerenciamento de metastore e descoberta de dados o torna atraente porque reduz a necessidade de gerenciar múltiplas ferramentas. Uma complicação que nossa equipe descobriu é a falta de recuperação automática de desastres no Unity Catalog gerenciado pelo Databricks. Conseguiram configurar sua própria funcionalidade de backup e restauração, mas uma solução fornecida pelo Databricks teria sido mais conveniente. Observe que, embora essas plataformas de governança geralmente implementam uma solução centralizada para garantir consistência entre espaços e cargas de trabalho, a responsabilidade de governar ainda pode ser federada, permitindo que equipes individuais governem seus próprios ativos.
Databricks Unity Catalog é uma solução de governança de dados para ativos como arquivos, tabelas ou modelos de aprendizado de máquina em um lakehouse. Embora você encontre várias plataformas no espaço de governança de dados corporativos, se você já estiver usando outras soluções Databricks, certamente deve avaliar o Unity Catalog. Queremos destacar que, embora essas plataformas de governança geralmente implementem uma solução centralizada para melhor consistência entre espaços de trabalho e cargas de trabalho, a responsabilidade de governar deve ser federada, permitindo que times individuais gerenciem seus próprios ativos.