Enable javascript in your browser for better experience. Need to know to enable it? Go here.
发布于 : Apr 03, 2024
Apr 2024
Trial ? 值得一试。了解为何要构建这一能力是很重要的。企业应当在风险可控的前提下在项目中尝试应用此项技术。

对数据帧进行比较是数据工程中的常见任务,常用于确保两个数据转换方法间没有显著的偏差或不一致。 DataComPy 是一个用于比较 pandas, Spark 或其他格式 DataFrame 的工具。这个库不仅能比较 DataFrame 的一致性,还能在行和列上对不一致的地方给出细致的洞见。 DataComPy 还可以指定忽略掉无需展示的数值绝对/相对比较和已知差异。我们的一些团队将它用于了冒烟测试组件中,他们发现它能高效比对大数据量多字段的 DataFrame,与此同时它给出的报告也易于理解和应对。

下载 PDF

 

English | Español | Português | 中文

订阅技术雷达简报

 

立即订阅

查看存档并阅读往期内容