Azure AI Document Intelligence (anteriormente Form Recognizer) extrae texto, tablas y pares clave-valor de documentos no estructurados y los transforma en datos estructurados. Utiliza modelos de deep learning preentrenados para interpretar el diseño y la semántica, y permite entrenar modelos personalizados mediante una interfaz sin código para formatos específicos. Sin embargo, en algunos casos, las personas usuarias avanzadas pueden necesitar una interfaz de ajuste fino personalizada. Uno de nuestros equipos informó que ADI redujo significativamente la entrada manual de datos, mejoró la precisión y aceleró la generación de reportes, lo que permitió tomar decisiones basadas en datos con mayor rapidez. Al igual que Amazon Textract y Google Document AI, ofrece procesamiento de documentos a nivel empresarial con una sólida comprensión del diseño. Una alternativa de código abierto emergente es Docling de IBM, que ofrece un enfoque más flexible y centrado en el código para la extracción de datos estructurados. En comparación con las herramientas tradicionales de OCR, ADI no solo captura texto, sino también estructura y relaciones, lo que facilita su integración en pipelines de datos posteriores. Dicho esto, hemos observado cierta latencia al integrarlo en flujos de trabajo síncronos, por lo que recomendamos usarlo principalmente para procesamiento asíncrono.