Enable javascript in your browser for better experience. Need to know to enable it? Go here.

Um longo processo exige melhor acesso a dados

 

Como uma das principais empresas do setor de ciências da vida, a Bayer conduz um complexo processo de desenvolvimento de medicamentos em várias etapas para garantir segurança e eficácia. Essa jornada pode levar mais de uma década, e cada etapa gera grandes volumes de dados que precisam ser armazenados com segurança e permanecer facilmente acessíveis para as pessoas pesquisadoras.

Melhorando a análise de dados pré-clínicos com PRINCE

 

Há quase quatro anos, a Thoughtworks trabalha em conjunto com a Bayer para extrair o máximo valor de seus dados pré-clínicos, aprimorando o acesso e a análise de programas de desenvolvimento de medicamentos passados e em andamento.

 

Inicialmente, foi criado um centro de informações pré-clínicas (PRINCE, uma plataforma de dados moderna construída na nuvem AWS), como um ponto único de acesso para todos os dados pré-clínicos.

 

Um dos pontos fortes da plataforma é a capacidade de combinar dados estruturados e não estruturados de cerca de 17.000 relatórios de estudos concluídos e seus metadados associados. Sempre que pessoas pesquisadoras precisam consultar um estudo anterior de um composto ou espécie específicos, podem encontrá-lo facilmente no PRINCE.

 

Quando a plataforma foi introduzida, acelerou significativamente a forma como cientistas trabalhavam com dados pré-clínicos e tornou mais conveniente para pesquisadoras encontrarem os insights de que precisavam. Mas, com uma mina de ouro de informações pré-clínicas disponível por meio da plataforma, a Bayer reconheceu que esse era apenas o começo do que poderia ser alcançado.

Uma maneira mais intuitiva de pesquisar dados pré-clínicos

 

A Bayer e a Thoughtworks buscaram aproveitar a riqueza de dados disponível no PRINCE e criar uma maneira rápida e acessível de pesquisar o conteúdo da plataforma.

 

Embora o PRINCE já estivesse repleto de dados valiosos, grande parte deles estava armazenada em formatos não estruturados, como PDFs, o que limitava sua exploração. A IA generativa apresentou uma oportunidade de desbloquear o valor contido nesses dados não estruturados e permitir que as equipes explorassem as pesquisas com facilidade.

Criação de um chatbot de IA para melhorar o acesso a dados pré-clínicos

 

No final de 2023, a equipe começou a desenvolver um chatbot sobre a plataforma PRINCE com o objetivo de:

 

  • Permitir que pessoas pesquisadoras e cientistas de dados pesquisem dados não estruturados fazendo perguntas simples.

     

  • Ajude gerentes de projeto a encontrar as informações necessárias para criar documentos para interações com as autoridades de saúde.

     

  • Projetar novos estudos com base no conhecimento existente.

     

  • Descubra descobertas específicas e outras informações cruciais em um vasto conjunto de documentos.

     

Devido à natureza sensível dos dados, o chatbot precisava estar em conformidade com rigorosos padrões de governança e conformidade de dados. E com os resultados da pesquisa podendo orientar os resultados de projetos futuros, as respostas do chatbot precisavam permanecer precisas e o mais próximo possível do texto específico usado nos documentos de origem.

Um chatbot inteligente para pesquisas sem esforço

 

Para concretizar essa visão de pesquisas sem esforço, a equipe se concentrou em quatro pilares fundamentais do design:

 

1.) Desenvolvimento do PRINCE com IA generativa

 

A Thoughtworks colaborou com a equipe da Bayer para criar um chatbot no PRINCE, usando LLMs hospedados pelo myGenAssist, a plataforma GenAI da Bayer. Inicialmente implementado em um grupo piloto de pessoas pesquisadoras, o chatbot foi posteriormente produzido depois de incorporar o feedback delas.

 

2.) Interface de linguagem natural para dados complexos

 

Por meio de uma interface intuitiva e conveniente, pesquisadoras podem fazer perguntas ao chatbot sobre projetos anteriores, compostos específicos ou relatórios históricos armazenados na plataforma. O chatbot gera respostas com base no conteúdo da Bayer armazenado no PRINCE. O contexto é definido com o uso de um pipeline RAG (Retrieval-Augmented Generation), que usa relatórios pré-clínicos como embeddings para identificar o contexto relevante.

 

3.) Confiança e transparência incorporadas

 

Cada resposta do chatbot também inclui a fonte original das informações, para que pesquisadoras possam explorar os dados com mais detalhes e verificar sua legitimidade e relevância. Enquanto isso, o pipeline inclui a plataforma de observabilidade Langfuse para monitorar continuamente a produção do chatbot e garantir que ele forneça resultados consistentemente confiáveis.

 

4.) Possibilitando a colaboração multifuncional em pesquisa

 

O chatbot da Bayer é particularmente útil nos casos em que pesquisadoras de várias funções colaboram em projetos. 

 

Em um exemplo hipotético, durante as reuniões de revisão de projetos, pesquisadoras poderiam pedir ao chatbot que trouxesse à tona quaisquer estudos relacionados ao tópico que estivessem discutindo – seja em relação a uma descoberta relacionada à segurança ou a um composto específico – e apresentasse as informações ao grupo. O chatbot correlaciona todas as descobertas com outros relatórios e visualizações armazenados no PRINCE.

O Chatbot eleva o PRINCE ao próximo nível de usabilidade e desempenho. O Chatbot ajuda a desvendar a riqueza de nosso conhecimento interno, que não pode ser facilmente recuperado por estratégias de busca convencionais usando palavras-chave e campos de pesquisa estabelecidos. Os recursos do Chatbot vão muito além do vocabulário controlado existente e facilitarão muito a verificação de hipóteses relacionadas à segurança. Um motor de busca focado em segurança está prestes a se tornar realidade.
Thomas Steger-Hartmann
Head of Investigational Toxicology na Bayer

De ferramenta de perguntas e respostas a assistente de pesquisa com IA agêntica

 

Embora o chatbot atue hoje como uma ferramenta de perguntas e respostas para simplificar as buscas no PRINCE, ele evoluirá ao longo do tempo para se tornar um assistente muito mais inteligente para pesquisadoras.

 

No futuro, o chatbot também poderá utilizar conteúdo externo de fontes confiáveis, como o PubMed, permitindo que pesquisadoras da Bayer considerem uma gama muito mais ampla de informações além de seus próprios conjuntos de dados.

 

A equipe do projeto também planeja desenvolver o chatbot do PRINCE como um assistente que ofereça suporte proativo a pesquisadoras, gerentes de projeto e cientistas de dados.

 

Além de disponibilizar insights prontos durante os projetos, o chatbot poderá gerar ideias para planos de descoberta de medicamentos, responder a consultas mais complexas e criar resumos de relatórios para as equipes da Bayer.

 

Tenho usado o PRINCE Chatbot há algumas semanas e é fantástico! Ele encontra rapidamente estudos, resume-os e extrai as principais conclusões. Também permite comparações complexas. Por exemplo, usei-o para localizar um estudo sobre quebras de fita de DNA com maior exposição em ratas fêmeas do que em ratos machos, o que ajudou muito no planejamento do meu estudo atual de genotoxicidade.
Verena Ziegler
Head of Genetic & Computational Toxicology na Bayer

Veja como estamos transformando a área de saúde e ciências da vida