Ir para o conteúdo principal
Serviços financeiros

Conformidade moderna de BSA/AML na Databricks

Como a Databricks Data Intelligence Platform unifica sistemas de AML em silos, pontuação de risco por ML e uma frota de agentes de IA em um único fluxo de trabalho governado: do alerta ao SAR registrado.

por Kateryna Savchyn , Pavithra Rao, Mimi Park e Emerson Bayuk

  • O que é? Uma experiência unificada, aumentada por agentes de IA e machine learning, para analistas e lideranças de AML, desenvolvida na Databricks Data Intelligence Platform.
  • Que problema ele resolve? Ele consolida os sistemas em silos que consomem a maior parte do tempo dos analistas durante uma investigação de AML, complementa a detecção baseada em regras com pontuação de risco orientada por ML e acelera a geração de relatórios SAR de horas para minutos — em um único ambiente governado.
  • Que resultados as equipes de AML podem esperar? Um tempo de processamento de casos de 8 a 10 vezes mais rápido, uma redução de 75% em falsos positivos e uma economia anual de US$ 50 a 150 milhões para instituições de médio a grande porte.

A função de prevenção à lavagem de dinheiro (AML) nos serviços financeiros tem sido historicamente organizada em torno de duas responsabilidades: a liberação de alertas de possíveis atividades de lavagem de dinheiro e a documentação do desfecho de cada caso, incluindo o envio de Relatórios de Atividades Suspeitas (SARs) quando necessário, tudo isso mantendo a eficácia do programa e a auditabilidade do processo. Esse modelo agora está sob pressão. A evolução das tipologias de crimes financeiros, as expectativas regulatórias de explicabilidade em tempo real e a maturidade da IA generativa estão remodelando a prática moderna de AML. Espera-se cada vez mais que os líderes de AML direcionem o tempo dos analistas para a inteligência real de crimes financeiros, em vez da coleta de dados, triagem de falsos positivos e redação de narrativas que dominam as cargas de trabalho hoje.

O obstáculo raramente é o talento ou a intenção. É o peso estrutural imposto a cada alerta por sistemas fragmentados, pontuações opacas de fornecedores e compilação manual de evidências. Até que esse peso seja removido, os programas de AML, por mais bem financiados que sejam, continuarão presos no modo de eliminação de pendências.

Por que as operações de AML atingiram uma barreira de produtividade

O ciclo típico de investigação de AML hoje é manual e propenso a erros. Os analistas passam de três a seis horas por caso extraindo e correlacionando dados em 10 ou mais sistemas isolados, incluindo: Know Your Customer (KYC), monitoramento de transações, triagem de sanções, gerenciamento de casos, mídia adversa, beneficiário final, CRM interno, registros de agências e bases de conhecimento regulatório — tudo reunido em planilhas e modelos do Word. A maior parte desse tempo é gasta com falsos positivos: a PwC estima que de 90% a 95% de todos os alertas gerados pelos sistemas de monitoramento de transações não são acionáveis, mas cada um consome o mesmo esforço de investigação que um positivo verdadeiro, porque nada conecta as evidências automaticamente. O monitoramento baseado em regras de primeira geração é cada vez mais superado por técnicas modernas de fraude baseadas em IA.

Esse peso se manifesta em quatro pontos:

  • Mais de 10 sistemas isolados. Os analistas são a camada de integração de fato. Cada alerta exige a autenticação em vários portais de fornecedores, a cópia de valores para um documento de trabalho e a conciliação manual de identificadores.
  • Alta taxa de falsos positivos. Regras e modelos de detecção que não são atualizados continuamente de acordo com a evolução das tipologias de crimes financeiros podem se desalinhar dos padrões reais de atividade, gerando alertas sobre transações que, no fim das contas, se mostram inofensivas. Cada alerta ainda consome as mesmas 3 a 6 horas de esforço de investigação, independentemente do resultado.
  • Documentação manual de casos. Cada caso exige uma resolução por escrito — escalonamento, descarte como falso positivo ou envio de SAR —, documentada e arquivada para auditoria regulatória. Os analistas criam esses relatórios manualmente do zero, citando as mesmas regulamentações e estruturando os mesmos pacotes de evidências caso após caso. Dados de uma pesquisa do Bank Policy Institute estimam o esforço dos bancos apenas para o envio de SARs em cerca de 21,4 horas por envio — mais de dez vezes a estimativa do próprio Paperwork Reduction Act da FinCEN.
  • Pontuação opaca de fornecedores. As plataformas de AML prontas para uso geralmente expõem limites de cenários para ajuste, mas os artefatos de modelo subjacentes, a engenharia de atributos (feature engineering) e a frequência de retreinamento geralmente residem no ambiente do fornecedor — dificultando para as instituições o cumprimento dos padrões de gerenciamento de risco de modelo (por exemplo, SR 11-7) e a resposta rápida quando os reguladores questionam como uma pontuação específica foi gerada.

O efeito cumulativo é um acúmulo de pendências que cresce mais rápido do que a equipe consegue resolver. Na PwC EMEA AML Survey 2024, 44% das instituições financeiras citam o aumento das regulamentações de crimes financeiros como o fator mais urgente que complica as operações de conformidade — e as tipologias da próxima década (pagamentos em tempo real, finanças integradas, pontes cripto-fiat, identidade sintética em escala) só vão aumentar essa lacuna.

A solução: a Plataforma de Inteligência de Dados da Databricks

Para passar da eliminação de pendências para a investigação ativa, as equipes de AML precisam de uma plataforma que não apenas armazene alertas, mas que raciocine sobre eles, e que faça isso sob a postura de governança que um regulador espera ver. A Plataforma de Inteligência de Dados da Databricks reúne monitoramento de transações, KYC, triagem de sanções, conhecimento regulatório e agentes de IA sob a governança do Unity Catalog, com linhagem completa desde a transação bruta até o SAR enviado. Cada componente é combinável, em vez de uma abordagem de tudo ou nada: as instituições podem adotar toda a tecnologia de ponta a ponta ou integrar partes individuais aos fluxos de trabalho existentes, o que é especialmente útil para equipes que estão começando a se modernizar. Seis recursos diferenciam essa abordagem das soluções tradicionais de AML:

1. Uma camada unificada de dados de conformidade governada pelo Unity Catalog

O Unity Catalog consolida mais de 10 sistemas isolados em um único lakehouse governado. O core banking, os fluxos de monitoramento de transações, os perfis de KYC, os resultados de sanções, o histórico de casos e a biblioteca de documentos de políticas de AML da instituição são ingeridos via Lakeflow Connect em uma arquitetura de medalhão Bronze → Prata → Ouro, com qualidade de dados garantida pelo Delta, mascaramento de colunas para PII de clientes e segurança em nível de linha vinculada à equipe e à função. Cada artefato downstream, a pontuação de risco, a cadeia de evidências do agente e o relatório de SAR têm sua linhagem rastreada de volta à sua linha de origem e ao carimbo de data/hora de ingestão. Quando o auditor pergunta o que acionou o alerta, quais evidências apoiaram o envio ou como a instituição lidou com casos estruturalmente semelhantes, a resposta é uma consulta reproduzível, e não a lembrança de um analista. A governança, a linhagem e a aplicação da qualidade são propriedades da plataforma, não uma camada adicional.

2. ML de ponta a ponta para detecção e pontuação de risco

Os mecanismos de regras estáticas são aprimorados, não substituídos. A Plataforma de Inteligência de Dados da Databricks oferece às equipes de ciência de dados e crimes financeiros a base para desenvolver, treinar e implantar modelos de ML de última geração adaptados ao histórico de transações, à base de clientes e ao perfil de risco da própria instituição — alimentando sinais mais ricos tanto na fila de alertas quanto no contexto da investigação. Os modelos são registrados no MLflow com codinomes de campeão/desafiante (champion/challenger) e rastreamento completo de experimentos; o Model Serving expõe o modelo ativo; o Lakehouse Monitoring observa o desvio (drift) e o desempenho em produção; e as tabelas de inferência capturam o feedback dos analistas que alimenta o retreinamento do desafiante. À medida que os desafiantes se mostram superiores, as equipes os promovem por meio do gerenciamento de ciclo de vida do MLflow. Cada alerta pode apresentar uma explicação das regras de negócios e dos sinais de ML que o acionaram, de modo que o analista abre um caso já sabendo por que ele foi parar na fila. O resultado é uma redução de 75% nos falsos positivos que chegam à fila do analista — sem a necessidade de substituir completamente o mecanismo de regras de monitoramento de transações subjacente.

3. Uma frota de agentes de IA especializados trabalhando em conjunto

O cerne da modernização é um assistente de chat multiagente que orquestra uma frota de subagentes especializados durante uma investigação, desenvolvido no Agent Bricks. Em vez de fazer login em vários sistemas para cruzar dados manualmente, o analista trabalha a partir de uma única página de investigação que apresenta notas de diligências anteriores, notas de caso, envios anteriores de SAR, padrões de transação e relações de entidades em uma única visualização. A frota de agentes varre toda a rede de dados disponíveis e retorna uma recomendação fundamentada sobre como lidar com o caso, com o ser humano no controle para a decisão final: encaminhar para uma equipe de especialistas, descartar como falso positivo ou prosseguir com o envio de SAR. O efeito de ponta a ponta: uma investigação que antes exigia de três a seis horas de trabalho manual é reduzida a minutos de revisão assistida por agentes.

4. Geração de SAR assistida por IA, de horas para minutos

Quando o analista prossegue com o arquivamento de SAR, a mesma frota de agentes preenche previamente os metadados contextuais coletados durante a investigação e elabora uma visão geral e uma narrativa personalizadas para o relatório. O analista valida as informações, personaliza e gera o PDF; a IA estrutura o documento para seguir as especificações de formato exigidas pela instituição antes do envio. Os relatórios arquivados são enviados para o backend com um registro totalmente rastreável sob a perspectiva de auditabilidade. A criação de relatórios SAR, que tradicionalmente levava horas, é concluída em minutos. Além disso, isso fecha o ciclo automaticamente e exibe instantaneamente o arquivamento como contexto e evidência adicionais para casos que estão sendo analisados ativamente em paralelo pelo restante da equipe de AML.

5. Visualização em grafos para detecção de padrões de rede

Uma camada de grafos, exibida por meio de visualizações interativas na bancada de trabalho do analista, permite que o analista saia da página de investigação e entre em uma visualização completa do grafo, faça perguntas em linguagem natural ao próprio grafo ou acesse diretamente qualquer entidade de forma individual para explorar os relacionamentos com contrapartes. Isso revela os padrões de rede ocultos que os sistemas baseados em regras não detectam: empresas de fachada, estruturas de estratificação e fluxos circulares de fundos.

6. Relatórios executivos com interface em linguagem natural

A liderança de AML acessa uma visualização executiva que exibe KPIs de volume de casos, horas gastas e alertas atrasados; linhas de tendência para detecção e tempo de pendência; uma visualização do fluxo do processo, desde a detecção e atribuição da equipe até a resolução; e detalhamentos por cenário e criticidade. Uma visualização de Desempenho da Equipe permite detalhar a vazão de incidentes, a pressão dos prazos de entrega e o tempo médio de resposta por tipo de detecção e equipe — tornando simples a identificação de gargalos no processo e de oportunidades para reequilibrar a equipe para cumprir prazos críticos. O chat em linguagem natural sobre os mesmos dados governados permite análises detalhadas em modelo de autoatendimento sobre tendências, sem precisar esperar por uma equipe de analytics: o Genie permite que os líderes de AML perguntem: "Quais relacionamentos de consultores geraram mais alertas de fracionamento no último trimestre e qual é a taxa de falsos positivos por equipe?" e recebam uma resposta pronta para auditoria em segundos.

Conclusão: Um novo padrão para a liderança de AML

As equipes de AML não precisam mais escolher entre a produtividade do analista e a capacidade de defesa regulatória. Uma Data Intelligence Platform governada, onde alertas, evidências, agentes e trilhas de auditoria residem no mesmo ambiente com rastreamento de linhagem, oferece ambos. A postura legada de "mais analistas, mais fornecedores, mais planilhas" não é mais competitiva em comparação com instituições que unificaram seus dados de conformidade e permitem que agentes de IA carreguem o fardo das investigações de múltiplas fontes. Essa mudança não é uma aspiração para o futuro; é uma decisão operacional disponível hoje.

Arquitetura em resumo

A solução é composta por cinco recursos disponíveis na Databricks Data Intelligence Platform:

  • Ingestão e governança. Lakeflow Connect insere dados bancários essenciais, fluxos de monitoramento de transações, perfis de KYC, correspondências de sanções, histórico de casos e documentos de políticas em uma arquitetura de medalhão Bronze → Silver → Gold no Delta, com o Unity Catalog aplicando mascaramento de colunas, segurança em nível de linha e linhagem de ponta a ponta.
  • Pontuação. Os modelos de detecção — ajustados ao histórico de transações e ao perfil de risco da própria instituição — são treinados e servidos por meio do MLflow com aliases de campeão/desafiante (champion/challenger); Model Serving expõe o modelo ativo; Lakehouse Monitoring monitora o desvio (drift); e as tabelas de inferência capturam o feedback do analista que alimenta o retreinamento do desafiante.
  • Raciocínio. Um assistente multiagente desenvolvido no Agent Bricks orquestra agentes Genie para consultas estruturadas, assistentes de conhecimento RAG apoiados por Vector Search sobre a biblioteca regulatória e de políticas da instituição, agentes externos exibidos por meio do MCP Marketplace e uma camada de grafos que resolve entidades e revela estruturas de contrapartes ocultas.
  • Estado operacional. Databricks Lakebase — um banco de dados Postgres gerenciado e totalmente integrado ao lakehouse — serve como o backend operacional para os agentes e aplicativos. O estado do caso, as notas do analista, o histórico de conversas do agente, os rascunhos de SAR e o status do fluxo de trabalho são persistidos no Lakebase com leituras e gravações de baixa latência, enquanto permanecem sincronizados com as tabelas Delta sob a mesma governança, linhagem e controles de acesso do Unity Catalog que se aplicam aos dados analíticos.
  • Experiência do analista e do executivo. Databricks Apps fornece a bancada de trabalho de investigações do analista, a visualização executiva, o explorador de grafos e a área de envio de SAR, lendo e gravando o estado operacional por meio do Lakebase com total rastreabilidade de auditoria nos relatórios arquivados.

Implantação modular

As cinco camadas podem ser implantadas de forma independente ou como uma pilha completa. Um banco que já executa seu próprio mecanismo de monitoramento de transações pode adotar apenas as camadas de pontuação ou raciocínio para adicionar pontuação de risco de ML e investigação aumentada por IA sobre os alertas existentes; um banco com gerenciamento de casos maduro, mas com dados fragmentados, pode começar com a camada de ingestão e governança para consolidar as fontes primeiro. Como cada componente compartilha a mesma Data Intelligence Platform e a governança do Unity Catalog, as implantações parciais se acumulam em direção à arquitetura completa sem a necessidade de migração de plataforma.

Implantação modular

As cinco camadas podem ser implantadas de forma independente ou como uma pilha completa. Um banco que já executa seu próprio mecanismo de monitoramento de transações pode adotar apenas as camadas de pontuação ou raciocínio para adicionar pontuação de risco de ML e investigação aumentada por IA sobre os alertas existentes; um banco com gerenciamento de casos maduro, mas com dados fragmentados, pode começar com a camada de ingestão e governança para consolidar as fontes primeiro. Como cada componente compartilha a mesma Data Intelligence Platform e a governança do Unity Catalog, as implantações parciais se acumulam em direção à arquitetura completa sem a necessidade de migração de plataforma.

Veja em ação

Assista à demonstração!

Implante a solução em seu workspace

▸ Fale conosco: entre em contato com a equipe de contas da Databricks para integrar isso ao seu fluxo de trabalho de AML existente hoje mesmo!

(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.