O que é uma biblioteca de aprendizado de máquina?

Como o Spark MLlib fornece algoritmos e utilitários de aprendizado de máquina escaláveis para que as equipes possam treinar, avaliar e implantar modelos em grandes conjuntos de dados com facilidade.

por Equipe da Databricks

Entenda como o MLlib do Apache Spark prioriza simplicidade, escalabilidade e integração para que você possa se concentrar em dados e modelos em vez de detalhes de sistemas distribuídos.
Explore os principais algoritmos e utilitários do MLlib, desde classificação e regressão até agrupamento, filtragem colaborativa e redução de dimensionalidade.
Veja como o MLlib se integra ao Spark SQL, Streaming e DataFrames e oferece suporte a várias linguagens para potencializar fluxos de trabalho de aprendizado de máquina de ponta a ponta.

A biblioteca de Machine Learning (MLlib) do Apache Spark é uma ferramenta projetada para ser simples, altamente escalável e facilmente integrada a outras ferramentas. A escalabilidade, compatibilidade de linguagem e alta velocidade do Spark permitem que os data scientists se concentrem em seus problemas e modelos de dados, em vez de resolver as complexidades que cercam os dados distribuídos (infraestrutura, configuração etc.). Criada no Spark, a MLlib é uma biblioteca escalável de machine learning que consiste em algoritmos e utilitários de aprendizado comuns, incluindo classificação, regressão, clustering, filtragem colaborativa, redução de dimensionalidade e primitivas de otimização subjacentes. O Spark MLlib se integra perfeitamente com outros componentes do Spark, como Spark SQL, Spark Streaming e DataFrame, e é instalado no Databricks Runtime. A biblioteca está disponível em Java, Scala e Python como parte das aplicações Spark e pode ser incluída em um fluxo de trabalho completo. A MLlib permite pré-processar e manipular dados, treinar modelos e fazer previsões em escala. Modelos treinados com a MLlib também podem ser usados para fazer previsões com streaming estruturado. O Spark fornece APIs avançadas de machine learning para executar uma variedade de tarefas de machine learning, desde classificação até regressão, clustering e deep learning.

Recursos adicionais

Receba os posts mais recentes na sua caixa de entrada

Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.

Ver todos os blogs

Recursos adicionais

O manual de IA agêntica para empresas

Receba os posts mais recentes na sua caixa de entrada

Sign up