Technology Radar

Datos sintéticos para modelos de prueba

Published : Oct 26, 2022

NOT ON THE CURRENT EDITION

This blip is not on the current edition of the Radar. If it was on one of the last few editions, it is likely that it is still relevant. If the blip is older, it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar. Understand more

Oct 2022

Assess

Durante nuestros debates para esta edición del Radar, surgieron varias herramientas y aplicaciones para la generación de datos sintéticos. A medida que las herramientas van madurando, hemos comprobado que el uso de datos sintéticos para modelos de prueba es una técnica potente y ampliamente útil. Aunque no pretenden sustituir a los datos reales a la hora de validar el poder de discriminación de los modelos de aprendizaje automático, los datos sintéticos pueden utilizarse en diversas situaciones. Por ejemplo, pueden usarse para evitar fallos catastróficos de los modelos en respuesta a sucesos que ocurren de forma excepcional o para testear las pipelines de datos sin exponer información personal identificable. Los datos sintéticos también son útiles para explorar casos límite que carecen de datos reales o para identificar el sesgo del modelo. Algunas herramientas útiles para generar datos son Faker o Synth, que generan datos que se ajustan a las propiedades estadísticas deseadas y herramientas como Synthetic Data Vault que pueden generar datos que imitan las propiedades de un conjunto de datos de referencia.

Download the PDF

English | Português

Sign up for the Technology Radar newsletter

Subscribe now

Industrias

Publicaciones Digitales y Herramientas

Todos los Insights

Datos sintéticos para modelos de prueba

Download the PDF

Sign up for the Technology Radar newsletter

Visit our archive to read the previous volumes