Ir para o conteúdo principal
História de cliente

Como a IA está mudando a descoberta de medicamentos

Milhões

Pontos de dados processados de milhares de fontes

AstraZeneca
INDUSTRY: Life sciences
CLOUD: AWS,Azure

“Ao mudar para Databricks, ganhamos uma ordem de grandeza no nosso desempenho.”

— Eliseo Papa, biólogo computacional da AstraZeneca

A AstraZeneca descobre, desenvolve e comercializa medicamentos inovadores para combater algumas das doenças mais graves do mundo. Há um grande obstáculo para a inovação: a incapacidade de explorar toda a informação científica disponível ao laboratório no ritmo em que ela chega. O laboratório precisava de uma plataforma para construir pipelines de dados escaláveis e de alto desempenho para alimentar modelos de machine learning projetados para ajudar os cientistas a tomar decisões intencionais. Com a Databricks, a AstraZeneca aproveitou dados e machine learning para criar um mecanismo de recomendação que ajuda os pesquisadores a descobrir novos medicamentos com mais facilidade, rapidez, economia e eficiência.

Muitos dados atrasam as decisões

Agora, sabemos que a descoberta, o desenvolvimento e a comercialização de novas classes de medicamentos podem levar de 10 a 15 anos e representam mais de cinco bilhões de dólares em investimentos em P&D – sabendo que pouco menos de 5% dos medicamentos acabarão sendo comercializados. Para a AstraZeneca, esse ritmo de inovação claramente não era suficiente. O laboratório, portanto, mudou para uma abordagem orientada por dados, a fim de aumentar sua taxa de sucesso na descoberta de medicamentos e garantir uma gestão mais segura dos ensaios clínicos.

No entanto, seus pesquisadores ainda não conseguiram tomar decisões informadas rapidamente, apesar de todas as informações de que dispunham. Em particular, eles estavam tendo problemas com dados que estavam em fontes diferentes, tanto dentro da empresa quanto em bancos de dados públicos externos. Além disso, com o ritmo acelerado de publicação de novas pesquisas científicas, tornou-se quase impossível se manter atualizado com as descobertas em tempo hábil.

  • Complexidade da infraestrutura: a AstraZeneca precisava de uma infraestrutura que fosse flexível, mas que não exigisse manutenção constante.

  • Grandes quantidades de dados desconexos: a empresa precisa ingerir, ler e analisar milhões de pontos de dados de centenas de fontes internas e públicas, como documentação técnica, bancos de dados públicos etc.

  • Dificuldade em expandir as operações para dar suporte ao trabalho de data science com notebooks Python de código aberto.

Pipelines de dados mais rápidos alimentam a inovação de ML

A AstraZeneca aproveita a Databricks Lakehouse Platform para ajudar a criar um gráfico de conhecimento de insights e dados biológicos. Este gráfico alimenta um sistema de recomendação que permite que cientistas da AstraZeneca gerem novas hipóteses, para qualquer doença, usando todos os dados à sua disposição.

  • Plataforma totalmente gerenciada: gerenciamento simplificado de cluster e manutenção de recursos analíticos em grande escala.

  • Criação de pipelines de dados de alto desempenho em escala: capacidade de aproveitar a NLP em uma grande biblioteca de literatura científica e fontes de dados para análise downstream.

  • Aceleração da inovação em machine learning: os data scientists têm o poder de criar e treinar modelos que fornecem previsões de classificação para tomar decisões mais inteligentes.

Transformação da maneira como os medicamentos são descobertos com IA

Desde a adoção da Databricks, a AstraZeneca conseguiu processar mais facilmente milhões de pontos de dados de milhares de fontes. Ao romper os obstáculos da escala, a empresa agora pode extrair insights significativos com confiança que podem levar a medicamentos inovadores que ajudarão as pessoas a viver uma vida mais saudável.

  • Eficiência operacional aprimorada: recursos como gerenciamento e dimensionamento automático de clusters melhoraram as operações, desde a ingestão de dados até o gerenciamento de todo o ciclo de vida do machine learning.

  • Melhor produtividade de data science: o ambiente de notebook compartilhado compatível com várias linguagens aumentou a produtividade da equipe.

  • Tempo de análise reduzido: o mecanismo de recomendação baseado na Databricks aumentou a capacidade do laboratório de criar hipóteses mais informadas, o que afeta diretamente o tempo de lançamento de novos medicamentos no mercado.