Aprendizado de máquina vs. Aprendizado profundo

Diferencie entre algoritmos tradicionais de aprendizado de máquina e redes neurais profundas que aprendem representações hierárquicas.

por Equipe da Databricks

Compreenda as diferenças entre Machine Learning e Deep Learning, incluindo seus algoritmos, casos de uso e requisitos de dados.
Aprenda como o Machine Learning utiliza técnicas estatísticas, enquanto o Deep Learning emprega redes neurais multicamadas.
Descubra quando aplicar o Machine Learning tradicional para dados estruturados e o Deep Learning para dados não estruturados, como imagens, texto e áudio.

Entenda as distinções fundamentais e onde cada uma se encaixa na AI.

Entendendo a hierarquia de AI, ML e DL

No mundo mais amplo da inteligência artificial (AI), os conceitos de machine learning e aprendizagem profunda costumam ser confundidos. A AI é o amplo campo de construção de sistemas inteligentes que realizam tarefas que exigem uma tomada de decisão semelhante à humana. Machine learning (ML) é um tipo de AI em que os sistemas aprendem padrões a partir da ingestão de data histórica para tomar decisões sem ser programados explicitamente para cada regra. A aprendizagem profunda (DL) é um subconjunto especializado de machine learning que usa redes neurais multicamadas para aprender automaticamente com grandes datasets para resolver problemas complexos de percepção e linguagem.

A seguinte hierarquia explica a relação entre AI, ML e DL:

Regras e lógicada Inteligência Artificial (AI)

└── Machine Learning (ML) substitui regras por experiência

└── Aprendizado automáticode aprendizagem profunda (DL)

ML e DL são abordagens para alcançar a AI. Na verdade, a maioria dos produtos de AI atuais são, na realidade, sistemas de ML, modelos de aprendizagem profunda ou pipelines de dados baseados em ML.

Aspecto	IA	ML	DL
Técnicas	Regras, lógica, pesquisa	Modelos estatísticos	Redes neurais
Requisito de dados	datasets médios-pequenos	datasets médios-pequenos	Datasets muito grandes
Aprendizagem necessária	Nem sempre	Sempre	Sempre
Adaptabilidade	Frequentemente estático	Melhora com mais dados	Melhora com mais dados
Necessidades de compute	Baixo a moderado	Moderado	Alta
Melhor para	Raciocínio, controle	Dados estruturados	Dados não estruturados
Exemplos	Planejamento, tomada de decisões	Recomendações	Visão, fala, linguagem

O que é machine learning?

Machine learning funciona ao permitir que um computador aprenda padrões a partir de dados e, em seguida, use esses padrões para fazer previsões ou tomar decisões. Ele melhora com a experiência, sem a necessidade de programação explícita. Os dados são o combustível para ML. Ela começa com um problema, ou uma pergunta, que você quer que o sistema responda e usa os dados coletados e normalizados em um modelo (um algoritmo que mapeia entradas para saídas). Cada modelo possui parâmetros aprendidos a partir de dados e hiperparâmetros escolhidos por humanos.

Os modelos de ML mais comuns incluem:

Regressão linear: algoritmos de ML que modelam a relação entre uma variável dependente (o que se deseja prever) e uma ou mais variáveis independentes (entradas), ajustando uma linha reta (ou hiperplano) aos dados. Este modelo aprende fazendo previsões sem coeficientes iniciais, medindo o erro entre as previsões e os valores reais, e ajustando os coeficientes para minimizar os erros.
Árvore de decisão: uma classe de algoritmos de ML que fazem previsões aprendendo um conjunto de regras “se então” a partir dos dados e, em seguida, dividem os dados em Branches com base nos valores dos recursos, formando uma estrutura semelhante a uma árvore. Cada pergunta é um nó de decisão, e cada resposta leva a uma branch até que um nó folha forneça a previsão final.
Floresta aleatória: um modelo que combina uma coleção de árvores de decisão para fazer previsões mais precisas e estáveis. Cada árvore é ensinada em uma amostra de dados diferente, e a previsão final é uma média ou uma votação majoritária sobre a melhor saída.
Máquinas de vetores de suporte (SVMs): uma classe de modelos de aprendizado de máquina (ML) usada para classificação e regressão, que encontra o melhor limite para separar os pontos de dados em diferentes classes.

Os modelos do machine learning aprendem padrões com mais eficácia por meio da engenharia de recursos, um processo de transformação de dados brutos em sinais úteis para um modelo. Um recurso é uma variável de entrada (numérica, categórica, data/hora, texto) usada por um modelo. Bons recursos podem melhorar a precisão, a interpretabilidade e reduzir o tempo de treinamento.

Os quatro tipos de machine learning

Aprendizagem supervisionada: uma abordagem de machine learning em que um modelo é treinado usando dados rotulados (dados que incluem tanto os recursos de entrada quanto a saída correta). São mostrados exemplos ao modelo e ele recebe a resposta correta para aprender um mapeamento. As tarefas comuns de aprendizagem supervisionada incluem classificação (spam versus não spam ou presença de doenças) ou regressão (previsão de preços, previsões de vendas).
Aprendizagem não supervisionada: machine learning em que um modelo encontra e aprende padrões a partir de dados não rotulados, que não possuem uma resposta predefinida. Ela consegue encontrar padrões agrupando pontos de dados semelhantes, reduzindo o número de recursos, encontrando pontos de dados anômalos ou raros ou encontrando relações entre variáveis. Exemplos práticos incluem segmentação de clientes e detecção de anomalias.
Aprendizagem semissupervisionada: uma abordagem de machine learning que utiliza uma pequena quantidade de dados rotulados junto com uma grande quantidade de dados não rotulados para ensinar um modelo. Os dados rotulados servem de base para o aprendizado, enquanto os dados não rotulados ajudam a refinar o limite de decisão. Essa abordagem é comumente usada para classificação de imagens, diagnóstico médico e reconhecimento de fala.
Aprendizagem por reforço: machine learning por tentativa e erro, em que um agente aprende interagindo com um ambiente, realizando ações e recebendo recompensas ou penalidades, em vez de aprender com exemplos rotulados (por exemplo, jogos, robótica).

O que é deep learning?

A aprendizagem profunda é uma abordagem de ML que usa redes neurais artificiais de várias camadas para aprender automaticamente padrões complexos a partir de grandes quantidades de dados. Elas são chamadas de redes neurais porque imitam a estrutura dos neurônios do cérebro humano. É uma das abordagens mais poderosas para construir sistemas de AI.

Com a aprendizagem profunda, os humanos não projetam os recursos a partir dos quais o aprendizado será realizado; os modelos aprendem representações diretamente dos dados brutos usando várias camadas de redes neurais. As camadas criam uma hierarquia de recursos e incluem uma camada de entrada, várias camadas ocultas e uma camada de saída. Cada camada aplica pesos, adiciona um viés e passa por uma ativação não linear.

Tipos Comuns de Redes Neurais

Redes feedforward: estas são as redes neurais mais simples e representam a arquitetura fundamental das redes neurais. Os dados fluem em uma única direção, da camada de entrada para as camadas ocultas e, em seguida, para as camadas de saída; portanto, são mais adequados para regressão e classificação de dados estruturados.
Redes neurais convolucionais (CNN): redes especializadas para dados em formato de grade. Ele usa filtros de convolução para detectar padrões como bordas e formas. É ideal para tarefas de reconhecimento de imagem e visão por computador.
Redes neurais recorrentes (RNNs): redes com ciclos de feedback que mantêm um estado oculto, projetadas para dados sequenciais como geração de texto, reconhecimento de fala e previsão de séries temporais.
Redes adversárias generativas (GANs): utilizadas para gerar novos dados realistas através do treinamento de duas redes neurais que competem entre si. Uma rede cria dados falsos e a outra tenta detectá-los, de modo que ambas melhoram através da competição. Os exemplos incluem geração de imagem, áudio e vídeo.

Semelhanças entre machine learning e a aprendizagem profunda

Tanto o machine learning (ML) quanto a aprendizagem profunda (DL) fazem parte do campo da AI e estão intimamente relacionados, pois a aprendizagem profunda é um subconjunto do machine learning. Eles compartilham muitos princípios fundamentais, fluxos de trabalho e objetivos. Ambos aprendem padrões a partir de dados e buscam fazer previsões ou tomar decisões com base nesses dados.

Quando aprendem com dados, ambos podem melhorar seu desempenho ao verem mais dados em um processo de aprendizado iterativo. E ambos podem generalizar a partir desses dados para dados novos, nunca antes vistos. Tanto o ML quanto o DL exigem treinamento com data histórica, validação para ajustar parâmetros e testes em dados não vistos.

E ambos podem ser aplicados a problemas de classificação, regressão e clusters.

Requisitos de dados e engenharia de recursos

Embora o machine learning e a aprendizagem profunda tenham muitas semelhanças, eles possuem requisitos de dados e esforços de engenharia de recursos diferentes. O aprendizado de máquina (ML) geralmente funciona bem com datasets estruturados de pequeno a médio porte, mas o desempenho depende da qualidade dos recursos, o que exige engenharia de recursos conduzida por humanos para identificar as variáveis relevantes.

O DL depende de grandes quantidades de dados não estruturados (imagens, texto, áudio) e a escala dos exemplos impacta diretamente o desempenho, já que o DL realiza extração automática de recursos com intervenção humana mínima.

Em aprendizado de máquina (ML), o conhecimento do domínio e a qualidade dos recursos são essenciais, enquanto em aprendizado profundo (DL), os modelos aprendem os recursos internamente, tornando a escala dos dados e a infraestrutura mais importantes.

Poder computacional e tempo de treinamento

É útil comparar os requisitos de compute e o tempo de treinamento necessários tanto para ML quanto para DL, pois esses são os fatores que mais afetam o custo, a velocidade de iteração e a viabilidade do produto dos seus sistemas. Modelos tradicionais de ML podem ser executados em CPUs padrão com menor memória, enquanto o DL requer GPUs ou TPUs com alta memória para treinamento eficiente, então os custos de infraestrutura serão maiores com DL.

Modelos de ML ensinam rapidamente para iteração e experimentação rápidas, enquanto modelos DL exigem tempos de treinamento mais longos devido a arquiteturas complexas e multicamadas. Assim, o custo de treinamento, a infraestrutura, a energia e a complexidade são maiores com o aprendizado profundo (DL), mas o aprendizado de máquina (ML) pode não ter um bom desempenho para problemas de grande escala.

Interpretabilidade e transparência

Outros fatores a considerar ao comparar machine learning e aprendizagem profunda são a interpretabilidade (quão facilmente um humano pode entender por que um modelo fez uma previsão) e a transparência (quão visíveis e explicáveis são a lógica interna e o processo de decisão do modelo).

Os modelos de ML são projetados para ser transparentes e, muitas vezes, mais interpretáveis, mostrando a importância de recursos e permitindo o raciocínio passo a passo. Por exemplo: as regras "se-então" das árvores de decisão são legíveis para humanos: os coeficientes de regressão linear mostram o impacto direto dos recursos, e as razões de chances da regressão linear explicam a influência.

Os modelos de DL agem mais como "caixas pretas" do ponto de vista de transparência. Eles não dependem de regras explícitas ou recursos projetados por humanos. Elas contêm milhões de parâmetros e aprendem representações hierárquicas e distribuídas, o que dificulta a compreensão de quais recursos causam uma previsão.

A interpretabilidade é importante para auditoria e torna-se fundamental em indústrias reguladas como saúde, finanças e jurídico, onde decisões de alto risco são tomadas rotineiramente e a confiança é essencial.

Quando usar machine learning

A orientação geral é usar o ML quando um problema bem definido envolve padrões em dados que são difíceis de definir com regras fixas, mas em que a aprendizagem profunda seria desnecessária ou ineficiente. O ML é adequado quando os dados são estruturados e o dataset é de tamanho pequeno a médio, como com dados de negócios (previsão de ventas, métricas financeiras, registros de clientes).

O ML é eficaz quando o orçamento de compute é limitado e a iteração rápida importa (detecção de fraudes, pontuação de crédito), e para aplicações onde interpretabilidade e explicabilidade são necessárias (finanças, saúde, seguros, jurídico).

Quando usar deep learning

O DL pode se destacar em problemas que envolvem padrões complexos em grandes quantidades de dados diversos e não estruturados, quando você tem GPUs/TPUs disponíveis e tempo para suportá-los. O aprendizado profundo (DL) é mais adequado para entradas difíceis de modelar com o ML tradicional (imagens, vídeo, áudio). O DL é necessário quando o projeto manual de recursos é difícil ou impossível, mas os dados brutos contêm sinais úteis. O aprendizado profundo também é apropriado quando a precisão é mais importante do que a interpretabilidade e o custo, e o sistema pode tolerar ciclos de treinamento mais longos.

O DL é especialmente eficaz quando há transferência de aprendizado disponível a partir de modelos pré-treinados (reconhecimento de imagem e objeto) e o problema envolve percepção ou linguagem (visão computacional, reconhecimento de fala, processamento de linguagem natural, veículos autônomos e robótica).

Exemplos Reais de AI

O ChatGPT é AI ou ML? A resposta é sim!

Lembre-se que ML e DL são ambos tipos de AI, e DL é um subconjunto de ML. Na verdade, o ChatGPT é um modelo de aprendizagem profunda construído com uma rede neural transformadora muito grande. O GPT (Generative Pre-Trained Transformer) está repleto de milhões a bilhões de parâmetros e grandes quantidades de dados de treinamento.

Sistemas populares de criação de imagens, como DALL-E e Midjourney, são modelos de difusão criados usando redes neurais profundas, portanto, ambos se encaixam na categoria DL. Ambos exigem treinamento em grande escala para criar imagens a partir de instruções de texto, computação intensiva e aprendizado de representação.

Quando a Netflix ou o Spotify fazem recomendações, eles usam uma combinação de modelos tradicionais de ML e modelos DL trabalhando juntos. Esses sistemas analisam o comportamento do usuário, os atributos do conteúdo e as semelhanças entre ambos para decidir qual conteúdo mostrar, em que ordem e para quais usuários. O ML é usado para classificação, personalização e testes A/B. A DL é usada para modelar o gosto do usuário, compreender o conteúdo e aprender as relações usuário-item em escala.

Na hierarquia do sistema de AI, esses produtos se apresentam da seguinte forma:

Inteligência artificial (IA)

└── Machine Learning (ML)

└── Modelos de filtragem colaborativa (Netflix/Spotify)

└── Deep learning (DL)

─ Modelos de difusão (DALL·E, Midjourney)

└── Modelos Transformer (ChatGPT/GPT, Netflix/Spotify)

Escolhendo a abordagem correta: uma lista de verificação de decisões

Tamanho do dataset:
Pequeno/estruturado = ML
Grande/não estruturado = DL

Necessidade de interpretabilidade
Alto = ML
Baixo = DL é aceitável

Recursos computacionais disponíveis
Limitado = ML
Robusto = DL é possível

Tipo de problema
Dados tabulares = ML
Imagens/texto/áudio = DL

Roteiros de aprendizado para ML versus DL

Aqui está um roteiro de aprendizado prático, começando com alguns fundamentos comuns, já que o aprendizado profundo se baseia nos fundamentos do ML. Lembre-se também de que o caminho específico que você seguir dependerá do problema a ser resolvido e dos recursos disponíveis em seu sistema.

Fundamentos compartilhados:

Aprenda programação básica e preparação de dados como fundamentos de Python, NumPy, Polars/pandas e visualização de dados (matplotlib, seaborn)
Conhecer os fundamentos da matemática, como álgebra linear, probabilidade, estatística e cálculo básico.
Aprenda os fundamentos do processamento de dados, como limpeza de dados, engenharia de recursos, treinamento, validação e testes.

Caminho de machine learning:

Conceitos básicos, como aprendizado supervisionado e não supervisionado, troca de viés e variância, sobreajuste e regularização e métricas de avaliação.
Foque em modelos clássicos de ML (regressão linear e logística, árvores de decisão, florestas aleatórias, SVMs).
Bibliotecas principais (scikit-learn)
Engenharia de recursos, incluindo codificação de variáveis categóricas, escalonamento e normalização, recursos baseados em tempo e agregações.
Técnicas de ajuste e validação de modelos, como validação cruzada, ajuste de hiperparâmetros, seleção de recursos e análise de erros.
Tarefas de ML em produção, incluindo implantação de modelos, monitoramento e detecção de drift, pipelines de retreinamento e explicabilidade.

Caminho de deep learning:

Fundamentos de redes neurais, incluindo perceptron, funções de ativação, funções de perda, retropropagação e otimização.
Arquiteturas principais de aprendizado profundo com foco em redes feedforward, CNNs (imagens), RNNs/LSTMs/GRUs (sequências) e transformers (NLP, visão computacional).
DL Frameworks (PyTorch, TensorFlow, Keras)
Treinamento (treinamento em GPU, treinamento distribuído, precisão mista e aprendizado por transferência)

Lembre-se de que o DL se baseia nos fundamentos do ML; portanto, comece com o básico de ML, independentemente do seu objetivo final.

A escolha certa para suas necessidades

Machine learning e aprendizagem profunda são duas abordagens para alcançar AI, dependendo das suas necessidades de dados, demandas computacionais, necessidades de interpretabilidade e casos de uso.

Os casos de uso de ML são tipicamente caracterizados por datasets menores e estruturados em forma de tabela. Geralmente, apresentam alta necessidade de interpretabilidade/explicabilidade e menores requisitos computacionais e de tempo despendido.

Os casos de uso de DL envolvem padrões complexos e grandes quantidades de dados diversos e não estruturados, e a precisão é mais importante do que a interpretabilidade. É necessária uma infraestrutura compute muito maior e um investimento de tempo considerável para o treinamento de modelos de aprendizado profundo.

A melhor escolha depende do seu problema específico e dos recursos disponíveis. Saiba que ambas as tecnologias continuam a evoluir, com arquiteturas de modelos mais robustas que utilizam menos memória, treinamento mais eficiente e melhor avaliação e teste. Há uma convergência crescente em AI, onde ML, DL e regras são combinados em sistemas híbridos. Novas aplicações e exigências regulatórias e de governança também influenciarão a forma como os modelos são construídos e implantados.

A ML não está substituindo o DL. Ambos continuam a evoluir lado a lado.

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.

Ver todos os blogs