Enable javascript in your browser for better experience. Need to know to enable it? Go here.
Published : Nov 05, 2025
NOT ON THE CURRENT EDITION
This blip is not on the current edition of the Radar. If it was on one of the last few editions, it is likely that it is still relevant. If the blip is older, it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar. Understand more
Nov 2025
Trial ?

En el paradigma de IA centrada en los datos, mejorar la calidad del conjunto de datos suele generar mayores incrementos de rendimiento que ajustar el modelo en sí. Cleanlab es una biblioteca de Python de código abierto diseñada para abordar este desafío al identificar automáticamente problemas comunes en los datos, como etiquetado incorrecto, valores atípicos y duplicados, en conjuntos de datos de texto, imagen, tabla y audio. Basado en el principio de confident learning, Cleanlab utiliza las probabilidades predichas por el modelo para estimar el ruido en las etiquetas y cuantificar la calidad de los datos. Este enfoque independiente del modelo permite a las personas desarrolladoras diagnosticar y corregir errores en los conjuntos de datos, y luego volver a entrenar los modelos para mejorar su solidez y precisión. Nuestros equipos han utilizado Cleanlab con éxito en entornos de producción, confirmando su efectividad en escenarios reales. Lo recomendamos como una herramienta valiosa para promover la estandarización de datos y mejorar la calidad de los conjuntos de datos en proyectos de ingeniería de IA.

Download the PDF

 

 

 

English |  Português 

Sign up for the Technology Radar newsletter

 

 

Subscribe now

Visit our archive to read the previous volumes