Ir para o conteúdo principal

O Framework de Sistema de IA da Databricks (DASF)

O Framework do Sistema de IA da Databricks (DASF) delineia os componentes chave de um moderno sistema de IA/ML, ajudando as organizações a avaliar riscos potenciais e aplicar as melhores práticas de segurança.

The Databricks AI Security Framework (DASF)

Resumo da Arquitetura

O Framework do Sistema de IA da Databricks (DASF) delineia os componentes chave de um moderno sistema de IA/ML, ajudando as organizações a avaliar riscos potenciais e aplicar as melhores práticas de segurança. Ao entender como esses componentes interagem, as organizações podem antecipar melhor as vulnerabilidades e aplicar as estratégias de mitigação apropriadas.

A equipe de Segurança da Databricks incorporou esses aprendizados na Plataforma de Inteligência de Dados da Databricks com controles integrados e links de documentação mapeados para segurança e conformidade.

O sistema é organizado em 12 componentes fundamentais agrupados em quatro estágios chave. Cada etapa representa um pilar crítico de fluxos de trabalho de IA e ML seguros, governados e operacionalmente eficientes.

I. Operações de Dados (Componentes 1–4)

As operações de dados se concentram na ingestão, preparação e catalogação de dados. Esta é a base de qualquer sistema de ML confiável, pois a qualidade do modelo depende da qualidade e segurança dos dados de entrada.

1. Dados brutos: Os dados são ingeridos de várias fontes (estruturadas, não estruturadas e semi-estruturadas). Nesta etapa, os dados devem ser armazenados de forma segura e com controle de acesso.

2. Preparação de dados: Esta etapa envolve limpeza, análise exploratória de dados (EDA), transformações e featurização. Faz parte do processo de extração, transformação e carga (ETL) e é essencial para derivar recursos de treinamento significativos.

3. Conjuntos de Dados: Conjuntos de dados preparados são divididos em conjuntos de treinamento, validação e teste. Esses conjuntos de dados devem ser versionados e reprodutíveis.

4. Catálogo: Um registro centralizado para ativos de dados: recursos, índices, modelos e funções. Ele suporta descoberta, linhagem, governança e compartilhamento seguro de dados entre equipes.

Mitigação de risco chave: Controles de acesso, criptografia, rastreamento de linhagem de dados e registro de auditoria ajudam a garantir que apenas usuários autorizados possam acessar, modificar ou compartilhar dados.

II. Operações de Modelo (Componentes 5–8)

As operações de modelo envolvem experimentação, avaliação e gerenciamento do ciclo de vida dos modelos de ML e IA.

5. Algoritmo: Algoritmos personalizados ou pré-construídos usados para desenvolver modelos preditivos.

6. Avaliação: Avaliação sistemática do desempenho do modelo usando dados de validação e métricas definidas.

7. Desenvolver e avaliar modelo: Isso inclui a construção de modelos do zero, o uso de APIs externas (por exemplo, OpenAI), o ajuste fino de modelos de base ou a aplicação de técnicas de aprendizado de transferência.

8. Gerenciamento de modelo: Rastreamento centralizado e governança de modelos, incluindo versionamento, rastros de auditoria e linhagem para reprodutibilidade e conformidade.

Mitigação de risco chave: A versão integrada, rastreamento de experimentos, controles de acesso e auditorias reduzem o risco de alterações não autorizadas no modelo e suportam rastreabilidade em todas as iterações do modelo.

III. Implantação e Serviço de Modelo (Componentes 9–10)

Esses componentes se concentram em entregar modelos de forma segura para produção e alimentar aplicações de IA.

9. Prompt/RAG (geração aumentada de recuperação): Permite acesso seguro e de baixa latência a dados estruturados e não estruturados para RAG e outras aplicações baseadas em inferência.

10. Infraestrutura de serviço: Compreende o serviço de modelo, gateways de IA e APIs que lidam com solicitações e respostas de inferência em agentes e aplicações de IA.

Mitigação de risco chave: Práticas seguras de implantação de modelos, como isolamento de contêineres, limitação de taxa de solicitação, validação de entrada e monitoramento de tráfego reduzem a superfície de ataque e garantem a disponibilidade consistente do serviço.

IV. Operações e Plataforma (Componentes 11–12)

Esta camada gerencia a segurança da infraestrutura, controle de acesso e confiabilidade do sistema em todos os ambientes.

11. Monitorar: Coleta continuamente logs, métricas e telemetria para desempenho do modelo, auditoria de segurança e observabilidade do sistema.

12. Operações e plataforma: Suporta CI/CD seguro, atualizações de plataforma, gerenciamento de vulnerabilidades e separação rigorosa de ambientes (desenvolvimento, staging, produção).

Mitigações de risco chave: Manter o isolamento do ambiente, aplicar patches regularmente, aplicar controle de acesso baseado em função e monitorar o comportamento do sistema ajudam a manter os padrões de segurança e conformidade ao longo do ciclo de vida da IA.

 

Conclusão

Esta arquitetura fornece uma visão abrangente de sistemas de IA seguros, governados e prontos para produção. Cada componente foi avaliado para risco, e os controles são incorporados nativamente na Plataforma de Inteligência de Dados da Databricks. As organizações podem usar isso como referência para acelerar a avaliação de segurança e a implementação de seus próprios sistemas de IA.

Recomendado

AI Agents on Mosaic AI in 5 Minutes

Vídeo sob demanda

AI Agents on Mosaic AI in 5 Minutes
Proteja e Governe Modelos Gen AI com o Mosaic AI Gateway no Databricks

Tour do produto

Proteja e Governe Modelos Gen AI com o Mosaic AI Gateway no Databricks
Databricks AI Security Framework (DASF) 2.0

Artigos técnicos

Databricks AI Security Framework (DASF) 2.0
Arquitetura de referência para operações de segurança

Arquitetura de Referência

Arquitetura de referência para operações de segurança