O Azure AI Document Intelligence (anteriormente Form Recognizer) extrai texto, tabelas e pares chave-valor de documentos não estruturados e os transforma em dados estruturados. Ele usa modelos de deep learning pré-treinados para interpretar layouts e semântica, e modelos customizados podem ser treinados por meio de uma interface no-code para formatos especializados. Em alguns casos, no entanto, usuários avançados podem precisar, em vez disso, de uma interface de ajuste fino (fine-tuning) customizada. Um de nossos times relatou que o ADI reduziu significativamente a entrada manual de dados, melhorou a acurácia dos dados e acelerou a geração de relatórios, levando a decisões orientadas a dados mais rápidas. Assim como o Amazon Textract e o Google Document AI, ele fornece processamento de documentos de nível empresarial com uma forte compreensão de layout. Uma alternativa de código aberto emergente é o Docling da IBM, que oferece uma abordagem mais flexível e centrada em código para a extração de dados estruturados. Em comparação com as ferramentas de OCR tradicionais, o ADI captura não apenas o texto, mas também a estrutura e os relacionamentos, facilitando a integração em pipelines de dados downstream. Dito isso, observamos uma latência ocasional ao incorporá-lo em workflows de usuário síncronos, por isso, recomendamos usá-lo principalmente para processamento assíncrono.