Ir para o conteúdo principal

O que é uma biblioteca de aprendizado de máquina?

Como o Spark MLlib fornece algoritmos e utilitários de aprendizado de máquina escaláveis ​​para que as equipes possam treinar, avaliar e implantar modelos em grandes conjuntos de dados com facilidade.

4 Personas AI Agents 5a

Summary

  • Entenda como o MLlib do Apache Spark prioriza simplicidade, escalabilidade e integração para que você possa se concentrar em dados e modelos em vez de detalhes de sistemas distribuídos.
  • Explore os principais algoritmos e utilitários do MLlib, desde classificação e regressão até agrupamento, filtragem colaborativa e redução de dimensionalidade.
  • Veja como o MLlib se integra ao Spark SQL, Streaming e DataFrames e oferece suporte a várias linguagens para potencializar fluxos de trabalho de aprendizado de máquina de ponta a ponta.

A biblioteca de Machine Learning (MLlib) do Apache Spark é uma ferramenta projetada para ser simples, altamente escalável e facilmente integrada a outras ferramentas. A escalabilidade, compatibilidade de linguagem e alta velocidade do Spark permitem que os data scientists se concentrem em seus problemas e modelos de dados, em vez de resolver as complexidades que cercam os dados distribuídos (infraestrutura, configuração etc.). Criada no Spark, a MLlib é uma biblioteca escalável de machine learning que consiste em algoritmos e utilitários de aprendizado comuns, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade e primitivas de otimização subjacentes. O Spark MLlib se integra perfeitamente com outros componentes do Spark, como Spark SQL, Spark Streaming e DataFrame, e é instalado no Databricks Runtime. A biblioteca está disponível em Java, Scala e Python como parte das aplicações Spark e pode ser incluída em um fluxo de trabalho completo. A MLlib permite pré-processar e manipular dados, treinar modelos e fazer previsões em escala. Modelos treinados com a MLlib também podem ser usados para fazer previsões com streaming estruturado. O Spark fornece APIs avançadas de machine learning para executar uma variedade de tarefas de machine learning, desde classificação até regressão, clustering e deep learning.

Recursos adicionais

UM LÍDER 5X

Gartner®: Databricks, líder em banco de dados em nuvem

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?

4 Personas Analytics AIBI 3a

Fundamentos de Data + AI

17 min de leitura

O que é Narrativa de Dados?

4 Personas Analytics AIBI 2a

Fundamentos de Data + AI

16 min de leitura

O que é Extrair, Carregar e Transformar (ELT)?