Menú

La información en esta página no se encuentra completamente disponible en tu idioma de preferencia. Muy pronto esperamos tenerla completamente disponible en otros idiomas. Para obtener información en tu idioma de preferencia, por favor descarga el PDF aquí.

Técnicas

Entrega continua para modelos de machine learning (CD4ML)

Nov 2019
Probar?

Con el aumento en popularidad de las aplicaciones basadas en machine learning, y la complejidad técnica que significa construirlas, nuestros equipos dependen mucho de la entrega continua para machine learning (CD4ML) para entregar estas aplicaciones de manera segura, rápida y sustentable. CD4ML es la disciplina de traer los principios y prácticas de entrega continua a las aplicaciones de machine learning. Elimina los largos ciclos entre el entrenamiento de los modelos y su despliegue a producción. CD4ML también elimina las transferencias manuales entre distintos equipos, ingenieras/os de datos, científicas/os de datos e ingenieras/os de machine learning en el proceso de extremo a extremo de construcción y despliegue de un modelo servido por una aplicación ML. Utilizando CD4ML nuestros equipos han logrado implementar de manera exitosa el versionamiento, prueba y despliegue automatizado de todos los componentes de sus aplicaciones basadas en ML: datos, modelos y código.

Apr 2019
Probar?

Continuous delivery for machine learning (CD4ML) models apply continuous delivery practices to developing machine learning models so that they are always ready for production. This technique addresses two main problems of traditional machine learning model development: long cycle time between training models and deploying them to production, which often includes manually converting the model to production-ready code; and using production models that had been trained with stale data.

A continuous delivery pipeline of a machine learning model has two triggers: (1) changes to the structure of the model and (2) changes to the training and test data sets. For this to work we need to both version the data sets and the model's source code. The pipeline often includes steps such as testing the model against the test data set, applying automatic conversion of the model (if necessary) with tools such as H2O, and deploying the model to production to deliver value.