Enable javascript in your browser for better experience. Need to know to enable it? Go here.
Publicado : Apr 03, 2024
Apr 2024
Trial ? Vale a pena ir atrás. É importante entender como desenvolver essa capacidade. As empresas devem experimentar esta tecnologia em um projeto que possa lidar com o risco.

Comparar DataFrames é uma tarefa comum na Engenharia de Dados, frequentemente realizada para verificar se não ocorreram desvios ou inconsistências significativas entre os resultados de duas abordagens de transformação de dados. O DataComPy é uma biblioteca Python que facilita a comparação de dois DataFrames no pandas, Spark e outras tecnologias. A biblioteca vai além de verificações básicas de igualdade, fornecendo insights detalhados sobre discrepâncias nos níveis de linha e coluna. O DataComPy também permite especificar tolerância absoluta ou relativa para comparação de colunas numéricas, bem como diferenças conhecidas que não precisam ser destacadas em seu relatório. Algumas de nossas equipes o utilizam como parte de seu pacote de smoke testing; elas consideram eficiente para comparar DataFrames grandes e complexos, e seus relatórios são fáceis de entender e acionar.

Baixe o PDF

 

 

 

English | Español | Português | 中文

Inscreva-se para receber o boletim informativo Technology Radar

 

 

Seja assinante

 

 

Visite nosso arquivo para acessar os volumes anteriores