Enable javascript in your browser for better experience. Need to know to enable it? Go here.
发布于 : Apr 26, 2023
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。 了解更多
Apr 2023
Assess ?

在之前的雷达中,我们介绍了例如 Great Expectations 的数据验证和测试平台,其可用于验证假设并测试用于培训或分类的输入数据的质量。但是有时候,只需要一个简单的代码库就可以直接在流水线中实现测试和质量检查。pandera 是一个 Python 库,用于测试和验证跨各种框架类型的数据,例如 pandas,Dask 或者 PySpark。 pandera 可以实现关于字段的简单断言或基于统计模型的假设验证。其广泛支持的框架库意味着只需编写一次测试就可以应用于各种底层数据格式。此外,pandera 还可以用于生成测试 ML 模型的合成数据 synthetic data to test ML models.

下载 PDF

 

English | Español | Português | 中文

订阅技术雷达简报

 

立即订阅

查看存档并阅读往期内容