Veröffentlicht: 19. Juli 2023
von Matei Zaharia, Patrick Wendell, Reynold Xin und Ali Ghodsi
Heute freuen wir uns, Ihnen mitteilen zu können, dass wir die Übernahme von MosaicML abgeschlossen haben, einer führenden Plattform für die Erstellung und Anpassung von generativen KI-Modellen für Ihr Unternehmen. Seit der Gründung von Databricks ist es unsere Mission, Daten und KI für jedes Unternehmen zugänglich zu machen. Generative KI wird die nächste Welle von Unternehmensdatenanwendungen antreiben, und gemeinsam mit MosaicML planen wir, die beste Erfahrung für das Training, die Anpassung und die Bereitstellung von generativen KI-Anwendungen zu bieten.
Wir werden gemeinsam mit dem MosaicML-Team daran arbeiten, die drei wichtigsten Entwicklungen zu beschleunigen, die unserer Meinung nach erforderlich sind, um generative KI für Unternehmen zum Mainstream zu machen:
Schnelle Demokratisierung von Modellfähigkeiten. Wir glauben an eine Zukunft, in der Modelle für jedes Unternehmen weit verbreitet sind. Die Demokratisierung jeder Technologie erfordert reduzierte Preise und erhöhten Zugang. Das MosaicML-Team hat sich darauf konzentriert, die Effizienz von Hard- und Software zu verbessern, um die Kosten für das Training und die Anpassung großer Sprachmodelle drastisch zu senken. Wir werden weiterhin zusammenarbeiten, um die Trainings- und Bereitstellungskosten zu senken, um einem immer größeren Teil des Marktes qualitativ hochwertige Modellierungsfähigkeiten zur Verfügung zu stellen. Demokratisierung erfordert auch Zugang zu Techniken. Wir werden mit dem Forschungsteam von MosaicML zusammenarbeiten, um weiterhin offen an Modellarchitekturen zu innovieren, wie z. B. denen, die die beliebten MPT-7B und MPT-30B Basis-LLMs antreiben. Bis heute wurde MPT-7B über 3 Millionen Mal heruntergeladen, was es zum meist heruntergeladenen Open-LLM aller Zeiten macht.
Generative KI-Modelle für Unternehmen nutzbar machen. Wir alle sind mit Allzweck-Chatbots vertraut geworden. Wie Consumer-Chatbots profitieren auch KI-Anwendungen für Unternehmen von Denkfähigkeiten und sprachbasierten Schnittstellen. Aber im Gegensatz zu allgemeinen Chatbots haben Unternehmensanwendungen viele zusätzliche Anforderungen. Sie müssen die großen Mengen an benutzerdefinierten Daten einbeziehen: Informationen über Geschäftsprozesse, Kunden, Konten, Bestellungen oder andere Aspekte ihres Geschäfts. Sie müssen die Privatsphäre und Sicherheit ihrer Benutzer und ihrer Daten gewährleisten. Unternehmensanwendungen haben auch wenig Toleranz für Halluzinationen oder falsche Antworten. Databricks und MosaicML werden es gemeinsam für Unternehmen viel einfacher machen, ihre eigenen Daten einzubeziehen, um sichere, geschützte und effektive KI-Anwendungen bereitzustellen.
Vereinheitlichung des KI- und Daten-Stacks. Jeder Teil des Modellentwicklungslebenszyklus erfordert gute Daten. Unternehmen werden sich von Wettbewerbern durch die Verwendung proprietärer Daten abheben, die es ihnen ermöglichen, bessere Modelle und intelligentere Anwendungen zu erstellen. Mit MosaicML wird Databricks weiterhin Daten in den Mittelpunkt der KI-Reise stellen. Dazu gehören vorgelagerte Datenaufbereitungsschritte wie die Bereinigung, Merkmalsextraktion und Einbettung von Daten für die Verwendung in Modellen. Dazu gehört auch die Verwendung von Daten zur Verbesserung von Modellen in einer positiven Rückkopplungsschleife, indem aus generierten Daten gelernt wird, wie Modelle funktionieren, und Modelle basierend auf früheren generierten Ergebnissen trainiert werden. In jeder Phase des Machine-Learning-Lebenszyklus müssen Daten und Modelle gemeinsam kuratiert werden, um die besten Anwendungen zu erstellen. Dies ist für generative Modelle, deren Qualität und Sicherheit so stark von guten Trainingsdaten abhängen, noch wichtiger.
Das Produkt von MosaicML, das es Unternehmen ermöglicht, große KI-Modelle effizient auf ihren eigenen Daten und Geschäftsprozessen zu erstellen, wird weiterhin direkt zum Kauf angeboten. Zukünftig werden wir MosaicML eng in die Lakehouse AI Platform integrieren – und den Trainings-Stack näher an die Kundendaten und andere Funktionen von Lakehouse AI bringen.
Wir freuen uns auf die Zukunft von Databricks und MosaicML und darauf, wie wir unsere Kunden bei ihren generativen KI-Ambitionen unterstützen können.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
