Synthetic Data Vault (SDV) é um ecossistema de bibliotecas para geração de dados sintéticos, que podem aprender a distribuição de um conjunto de dados para gerar dados sintéticos com o mesmo formato e propriedades estatísticas da fonte. No passado, falamos sobre as desvantagens de usar dados de produção em ambientes de teste. No entanto, as nuances da distribuição dos dados em produção dificilmente podem ser replicadas manualmente, resultando em defeitos e surpresas. Tivemos boas experiências usando SDV para gerar grandes volumes de dados para testes de desempenho. O SDV se sai bem com a modelagem de uma tabela única. No entanto, o tempo de geração de dados aumenta consideravelmente conforme o número de tabelas com restrições de chave estrangeira aumenta. Apesar disso, SDV é uma ótima promessa para testes de desempenho local. É uma boa ferramenta para geração de dados sintéticos e vale a pena considerar para suas necessidades de teste.
Synthetic Data Vault (SDV) é um ecossistema de bibliotecas de geração de dados sintéticos que pode aprender a distribuição de um conjunto de dados para gerar dados sintéticos com o mesmo formato e propriedades estatísticas que a fonte. No passado, falamos sobre as desvantagens de usar dados de produção em ambientes de teste. No entanto, as nuances da distribuição de dados em produção dificilmente podem ser replicadas manualmente, resultando em defeitos e surpresas. Acreditamos que o SDV e ferramentas semelhantes podem resolver essa lacuna gerando dados semelhantes à produção para tabela única, tabela múltipla complexa e séries temporais multivariadas. Embora o SDV não seja novo, gostamos bastante e decidimos destacá-lo.