Direkt zum Hauptinhalt

Was ist eine Machine Learning Library?

Wie Spark MLlib skalierbare ML-Algorithmen und -Dienstprogramme bereitstellt, damit Teams Modelle auf großen Datensätzen problemlos trainieren, evaluieren und bereitstellen können

4 Personas AI Agents 5a

Summary

  • Erfahren Sie, wie Apache Sparks MLlib auf Einfachheit, Skalierbarkeit und Integration setzt, damit Sie sich auf Daten und Modelle statt auf Details verteilter Systeme konzentrieren können.
  • Entdecken Sie die Kernalgorithmen und -funktionen von MLlib – von Klassifizierung und Regression über Clustering und kollaboratives Filtern bis hin zur Dimensionsreduktion.
  • Sehen Sie, wie MLlib sich in Spark SQL, Streaming und DataFrames integriert und mehrere Programmiersprachen unterstützt, um durchgängige Machine-Learning-Workflows zu ermöglichen.

Die Machine Learning Library (MLlib) von Apache Spark ist auf Einfachheit, Skalierbarkeit und bequeme Integration mit anderen Tools ausgelegt. Dank der Skalierbarkeit, der Sprachkompatibilität und der Geschwindigkeit von Spark können sich Data Scientists ihren Datenproblemen und -modellen widmen, statt sich mit den komplexen Aspekten verteilter Daten (Infrastruktur, Konfigurationen usw.) auseinandersetzen zu müssen. MLlib setzt auf Spark auf. Es handelt sich um eine skalierbare Machine-Learning-Bibliothek, die aus gängigen Lernalgorithmen und Hilfsprogrammen etwa für Klassifizierung, Regression, Clustering, kollaboratives Filtern, Dimensionalitätsreduktion und zugrundeliegende Optimierungsprimitive besteht. Spark MLLib integriert sich nahtlos in andere Spark-Komponenten wie Spark SQL, Spark Streaming und DataFrames und wird in der Databricks-Laufzeitumgebung installiert. Die Bibliothek kann in Java, Scala und Python als Bestandteil von Spark-Anwendungen genutzt und daher in komplette Workflows eingefügt werden. MLlib ermöglicht Preprocessing, Munging, das Trainieren von Modellen und das datengestützte Erstellen von Prognosen im großen Maßstab. Sie können sogar in MLlib trainierte Modelle verwenden, um Vorhersagen in Structured Streaming zu treffen. Spark stellt eine ausgefeilte API für maschinelles Lernen zur Verfügung, mit der Sie eine Vielzahl von Machine-Learning-Aufgaben erledigen können – von der Klassifizierung über Regression und Clustering bis hin zu Deep Learning.

Zusätzliche Ressourcen

5-FACHER LEADER

Gartner®: Databricks als Leader für Cloud-Datenbanken

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Was kommt als Nächstes?

4 Personas Analytics AIBI 3a

Fundamentos de Data + AI

17 min Lesezeit

O que é Narrativa de Dados?

4 Personas Analytics AIBI 2a

Fundamentos de Data + AI

16 min Lesezeit

O que é Extrair, Carregar e Transformar (ELT)?