Browser Use é uma biblioteca Python de código aberto que permite que agentes baseados em LLM operem navegadores web e interajam com aplicações web. Ela pode navegar, inserir dados, extrair texto e gerenciar múltiplas abas para coordenar ações entre aplicações. A biblioteca é particularmente útil quando agentes de IA precisam acessar, manipular ou recuperar informações de conteúdo web. Ela suporta uma variedade de LLMs e utiliza o Playwright para combinar o entendimento visual com a extração da estrutura HTML para interações web mais ricas. Nossos times integraram o Browser Use com o framework Pytest e relatórios do Allure para explorar testes automatizados com LLMs. Os passos de teste foram escritos em linguagem natural para o agente executar, capturando screenshots em asserções ou falhas. O objetivo era permitir QA fora do horário de expediente, buscando automaticamente os casos de teste do Confluence para verificação pós-desenvolvimento. Os resultados iniciais são promissores, embora as respostas do agente pós-tarefa muitas vezes não tenham descrições detalhadas de falhas, exigindo relatórios de erro customizados.
Browser Use é uma biblioteca python de código aberto que permite que agentes de IA baseados em modelos de linguagem de grande porte (LLMs) usem navegadores da web e acessem aplicações web. Ela pode controlar o navegador e executar etapas que incluem exploração de páginas, entrada de dados e extração de textos. Com a capacidade de gerenciar várias guias, ela pode executar ações coordenadas em diferentes aplicações web. Isso é útil para cenários onde agentes baseados em LLM precisam acessar conteúdo da web, executar ações nele e obter resultados. A biblioteca pode trabalhar com uma variedade de LLMs. Ela aproveita o Playwright para controlar o navegador, combinando compreensão visual com extração de estrutura HTML para melhor interação na web. Esta biblioteca está ganhando força em cenários multiagentes, permitindo que os agentes colaborem em fluxos de trabalho complexos envolvendo interações na web.