Enable javascript in your browser for better experience. Need to know to enable it? Go here.
Published : Apr 26, 2023
NOT ON THE CURRENT EDITION
This blip is not on the current edition of the Radar. If it was on one of the last few editions, it is likely that it is still relevant. If the blip is older, it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar. Understand more
Apr 2023
Assess ?

En versiones anteriores del radar, presentamos plataformas de prueba y validación de datos como Great Expectations que pueden ser usados para validar supuestos y probar la calidad de los datos entrantes utilizados para entrenamiento o clasificación. A veces, sin embargo, lo que necesitas es una simple librería de código para implementar verificaciones de pruebas y controles de calidad directamente en los pipelines. pandera es una librería en Python para probar y validar datos a través de una amplia gama de tipos de frames como pandas, Dask o PySpark. pandera puede implementar aserciones simples sobre campos o pruebas de hipótesis basadas en modelos estadísticos. La amplia gama de librerías de frames compatibles implica que las pruebas pueden ser escritas una vez y luego aplicada a una variedad de formatos de datos subyacentes. pandera puede usarse también para generar datos sintéticos para probar modelos ML.

Download the PDF

 

 

 

English | Português

Sign up for the Technology Radar newsletter

 

 

Subscribe now

Visit our archive to read the previous volumes