Entenda as distinções fundamentais e onde cada uma se encaixa na AI.
No mundo mais amplo da inteligência artificial (AI), os conceitos de machine learning e aprendizagem profunda costumam ser confundidos. A AI é o amplo campo de construção de sistemas inteligentes que realizam tarefas que exigem uma tomada de decisão semelhante à humana. Machine learning (ML) é um tipo de AI em que os sistemas aprendem padrões a partir da ingestão de data histórica para tomar decisões sem ser programados explicitamente para cada regra. A aprendizagem profunda (DL) é um subconjunto especializado de machine learning que usa redes neurais multicamadas para aprender automaticamente com grandes datasets para resolver problemas complexos de percepção e linguagem.
A seguinte hierarquia explica a relação entre AI, ML e DL:
Regras e lógicada Inteligência Artificial (AI)
└── Machine Learning (ML) substitui regras por experiência
└── Aprendizado automáticode aprendizagem profunda (DL)
ML e DL são abordagens para alcançar a AI. Na verdade, a maioria dos produtos de AI atuais são, na realidade, sistemas de ML, modelos de aprendizagem profunda ou pipelines de dados baseados em ML.
| Aspecto | IA | ML | DL |
|---|---|---|---|
| Técnicas | Regras, lógica, pesquisa | Modelos estatísticos | Redes neurais |
| Requisito de dados | datasets médios-pequenos | datasets médios-pequenos | Datasets muito grandes |
| Aprendizagem necessária | Nem sempre | Sempre | Sempre |
| Adaptabilidade | Frequentemente estático | Melhora com mais dados | Melhora com mais dados |
| Necessidades de compute | Baixo a moderado | Moderado | Alta |
| Melhor para | Raciocínio, controle | Dados estruturados | Dados não estruturados |
| Exemplos | Planejamento, tomada de decisões | Recomendações | Visão, fala, linguagem |
Machine learning funciona ao permitir que um computador aprenda padrões a partir de dados e, em seguida, use esses padrões para fazer previsões ou tomar decisões. Ele melhora com a experiência, sem a necessidade de programação explícita. Os dados são o combustível para ML. Ela começa com um problema, ou uma pergunta, que você quer que o sistema responda e usa os dados coletados e normalizados em um modelo (um algoritmo que mapeia entradas para saídas). Cada modelo possui parâmetros aprendidos a partir de dados e hiperparâmetros escolhidos por humanos.
Os modelos de ML mais comuns incluem:
Os modelos do machine learning aprendem padrões com mais eficácia por meio da engenharia de recursos, um processo de transformação de dados brutos em sinais úteis para um modelo. Um recurso é uma variável de entrada (numérica, categórica, data/hora, texto) usada por um modelo. Bons recursos podem melhorar a precisão, a interpretabilidade e reduzir o tempo de treinamento.
A aprendizagem profunda é uma abordagem de ML que usa redes neurais artificiais de várias camadas para aprender automaticamente padrões complexos a partir de grandes quantidades de dados. Elas são chamadas de redes neurais porque imitam a estrutura dos neurônios do cérebro humano. É uma das abordagens mais poderosas para construir sistemas de AI.
Com a aprendizagem profunda, os humanos não projetam os recursos a partir dos quais o aprendizado será realizado; os modelos aprendem representações diretamente dos dados brutos usando várias camadas de redes neurais. As camadas criam uma hierarquia de recursos e incluem uma camada de entrada, várias camadas ocultas e uma camada de saída. Cada camada aplica pesos, adiciona um viés e passa por uma ativação não linear.
Tanto o machine learning (ML) quanto a aprendizagem profunda (DL) fazem parte do campo da AI e estão intimamente relacionados, pois a aprendizagem profunda é um subconjunto do machine learning. Eles compartilham muitos princípios fundamentais, fluxos de trabalho e objetivos. Ambos aprendem padrões a partir de dados e buscam fazer previsões ou tomar decisões com base nesses dados.
Quando aprendem com dados, ambos podem melhorar seu desempenho ao verem mais dados em um processo de aprendizado iterativo. E ambos podem generalizar a partir desses dados para dados novos, nunca antes vistos. Tanto o ML quanto o DL exigem treinamento com data histórica, validação para ajustar parâmetros e testes em dados não vistos.
E ambos podem ser aplicados a problemas de classificação, regressão e clusters.
Embora o machine learning e a aprendizagem profunda tenham muitas semelhanças, eles possuem requisitos de dados e esforços de engenharia de recursos diferentes. O aprendizado de máquina (ML) geralmente funciona bem com datasets estruturados de pequeno a médio porte, mas o desempenho depende da qualidade dos recursos, o que exige engenharia de recursos conduzida por humanos para identificar as variáveis relevantes.
O DL depende de grandes quantidades de dados não estruturados (imagens, texto, áudio) e a escala dos exemplos impacta diretamente o desempenho, já que o DL realiza extração automática de recursos com intervenção humana mínima.
Em aprendizado de máquina (ML), o conhecimento do domínio e a qualidade dos recursos são essenciais, enquanto em aprendizado profundo (DL), os modelos aprendem os recursos internamente, tornando a escala dos dados e a infraestrutura mais importantes.
É útil comparar os requisitos de compute e o tempo de treinamento necessários tanto para ML quanto para DL, pois esses são os fatores que mais afetam o custo, a velocidade de iteração e a viabilidade do produto dos seus sistemas. Modelos tradicionais de ML podem ser executados em CPUs padrão com menor memória, enquanto o DL requer GPUs ou TPUs com alta memória para treinamento eficiente, então os custos de infraestrutura serão maiores com DL.
Modelos de ML ensinam rapidamente para iteração e experimentação rápidas, enquanto modelos DL exigem tempos de treinamento mais longos devido a arquiteturas complexas e multicamadas. Assim, o custo de treinamento, a infraestrutura, a energia e a complexidade são maiores com o aprendizado profundo (DL), mas o aprendizado de máquina (ML) pode não ter um bom desempenho para problemas de grande escala.
Outros fatores a considerar ao comparar machine learning e aprendizagem profunda são a interpretabilidade (quão facilmente um humano pode entender por que um modelo fez uma previsão) e a transparência (quão visíveis e explicáveis são a lógica interna e o processo de decisão do modelo).
Os modelos de ML são projetados para ser transparentes e, muitas vezes, mais interpretáveis, mostrando a importância de recursos e permitindo o raciocínio passo a passo. Por exemplo: as regras "se-então" das árvores de decisão são legíveis para humanos: os coeficientes de regressão linear mostram o impacto direto dos recursos, e as razões de chances da regressão linear explicam a influência.
Os modelos de DL agem mais como "caixas pretas" do ponto de vista de transparência. Eles não dependem de regras explícitas ou recursos projetados por humanos. Elas contêm milhões de parâmetros e aprendem representações hierárquicas e distribuídas, o que dificulta a compreensão de quais recursos causam uma previsão.
A interpretabilidade é importante para auditoria e torna-se fundamental em indústrias reguladas como saúde, finanças e jurídico, onde decisões de alto risco são tomadas rotineiramente e a confiança é essencial.
A orientação geral é usar o ML quando um problema bem definido envolve padrões em dados que são difíceis de definir com regras fixas, mas em que a aprendizagem profunda seria desnecessária ou ineficiente. O ML é adequado quando os dados são estruturados e o dataset é de tamanho pequeno a médio, como com dados de negócios (previsão de ventas, métricas financeiras, registros de clientes).
O ML é eficaz quando o orçamento de compute é limitado e a iteração rápida importa (detecção de fraudes, pontuação de crédito), e para aplicações onde interpretabilidade e explicabilidade são necessárias (finanças, saúde, seguros, jurídico).
O DL pode se destacar em problemas que envolvem padrões complexos em grandes quantidades de dados diversos e não estruturados, quando você tem GPUs/TPUs disponíveis e tempo para suportá-los. O aprendizado profundo (DL) é mais adequado para entradas difíceis de modelar com o ML tradicional (imagens, vídeo, áudio). O DL é necessário quando o projeto manual de recursos é difícil ou impossível, mas os dados brutos contêm sinais úteis. O aprendizado profundo também é apropriado quando a precisão é mais importante do que a interpretabilidade e o custo, e o sistema pode tolerar ciclos de treinamento mais longos.
O DL é especialmente eficaz quando há transferência de aprendizado disponível a partir de modelos pré-treinados (reconhecimento de imagem e objeto) e o problema envolve percepção ou linguagem (visão computacional, reconhecimento de fala, processamento de linguagem natural, veículos autônomos e robótica).
O ChatGPT é AI ou ML? A resposta é sim!
Lembre-se que ML e DL são ambos tipos de AI, e DL é um subconjunto de ML. Na verdade, o ChatGPT é um modelo de aprendizagem profunda construído com uma rede neural transformadora muito grande. O GPT (Generative Pre-Trained Transformer) está repleto de milhões a bilhões de parâmetros e grandes quantidades de dados de treinamento.
Sistemas populares de criação de imagens, como DALL-E e Midjourney, são modelos de difusão criados usando redes neurais profundas, portanto, ambos se encaixam na categoria DL. Ambos exigem treinamento em grande escala para criar imagens a partir de instruções de texto, computação intensiva e aprendizado de representação.
Quando a Netflix ou o Spotify fazem recomendações, eles usam uma combinação de modelos tradicionais de ML e modelos DL trabalhando juntos. Esses sistemas analisam o comportamento do usuário, os atributos do conteúdo e as semelhanças entre ambos para decidir qual conteúdo mostrar, em que ordem e para quais usuários. O ML é usado para classificação, personalização e testes A/B. A DL é usada para modelar o gosto do usuário, compreender o conteúdo e aprender as relações usuário-item em escala.
Na hierarquia do sistema de AI, esses produtos se apresentam da seguinte forma:
Inteligência artificial (IA)
└── Machine Learning (ML)
└── Modelos de filtragem colaborativa (Netflix/Spotify)
└── Deep learning (DL)
─ Modelos de difusão (DALL·E, Midjourney)
└── Modelos Transformer (ChatGPT/GPT, Netflix/Spotify)
Tamanho do dataset:
Pequeno/estruturado = ML
Grande/não estruturado = DL
Necessidade de interpretabilidade
Alto = ML
Baixo = DL é aceitável
Recursos computacionais disponíveis
Limitado = ML
Robusto = DL é possível
Tipo de problema
Dados tabulares = ML
Imagens/texto/áudio = DL
Aqui está um roteiro de aprendizado prático, começando com alguns fundamentos comuns, já que o aprendizado profundo se baseia nos fundamentos do ML. Lembre-se também de que o caminho específico que você seguir dependerá do problema a ser resolvido e dos recursos disponíveis em seu sistema.
Fundamentos compartilhados:
Caminho de machine learning:
Caminho de deep learning:
Lembre-se de que o DL se baseia nos fundamentos do ML; portanto, comece com o básico de ML, independentemente do seu objetivo final.
Machine learning e aprendizagem profunda são duas abordagens para alcançar AI, dependendo das suas necessidades de dados, demandas computacionais, necessidades de interpretabilidade e casos de uso.
Os casos de uso de ML são tipicamente caracterizados por datasets menores e estruturados em forma de tabela. Geralmente, apresentam alta necessidade de interpretabilidade/explicabilidade e menores requisitos computacionais e de tempo despendido.
Os casos de uso de DL envolvem padrões complexos e grandes quantidades de dados diversos e não estruturados, e a precisão é mais importante do que a interpretabilidade. É necessária uma infraestrutura compute muito maior e um investimento de tempo considerável para o treinamento de modelos de aprendizado profundo.
A melhor escolha depende do seu problema específico e dos recursos disponíveis. Saiba que ambas as tecnologias continuam a evoluir, com arquiteturas de modelos mais robustas que utilizam menos memória, treinamento mais eficiente e melhor avaliação e teste. Há uma convergência crescente em AI, onde ML, DL e regras são combinados em sistemas híbridos. Novas aplicações e exigências regulatórias e de governança também influenciarão a forma como os modelos são construídos e implantados.
A ML não está substituindo o DL. Ambos continuam a evoluir lado a lado.
