En versiones anteriores del radar, presentamos plataformas de prueba y validación de datos como Great Expectations que pueden ser usados para validar supuestos y probar la calidad de los datos entrantes utilizados para entrenamiento o clasificación. A veces, sin embargo, lo que necesitas es una simple librería de código para implementar verificaciones de pruebas y controles de calidad directamente en los pipelines. pandera es una librería en Python para probar y validar datos a través de una amplia gama de tipos de frames como pandas, Dask o PySpark. pandera puede implementar aserciones simples sobre campos o pruebas de hipótesis basadas en modelos estadísticos. La amplia gama de librerías de frames compatibles implica que las pruebas pueden ser escritas una vez y luego aplicada a una variedad de formatos de datos subyacentes. pandera puede usarse también para generar datos sintéticos para probar modelos ML.