Nutzen Sie Genie Code, um den gesamten ML-Lifecycle zu beschleunigen, AI Runtime, um Deep-Learning-Modelle im großen Maßstab zu trainieren, und Feature und Model Serving, um Echtzeit-ML im großen Maßstab zu betreiben.
von Tejas Sundaresan und Mike Del Balso
Es gab noch nie eine dynamischere und aufregendere Zeit, um eigene AI-Modelle und -Systeme zu entwickeln. Von der Nachfrageprognose und Betrugserkennung bis hin zu Suche, Empfehlungen, Personalisierung und multimodaler AI – Machine Learning treibt geschäftskritische Anwendungen in jeder Branche an.
Auf dem Data + AI Summit 2026 freuen wir uns sehr, die folgenden neuen Funktionen in der Databricks AI Platform vorzustellen:
Zusammen vereinfachen diese Funktionen den Weg vom Experimentieren bis zur Produktion und ermöglichen es Unternehmen, AI-Anwendungen erheblich schneller als je zuvor zu entwickeln, bereitzustellen und zu skalieren.
Werfen wir einen genaueren Blick auf die Neuerungen.
Heutzutage kann es Monate dauern, ein ML-Modell in die Produktion zu bringen, da Teams unzählige Stunden mit sich wiederholenden Aufgaben im gesamten ML-Lebenszyklus verbringen – vom Feature Engineering und der Experimentverwaltung bis hin zur Modellbewertung und Bereitstellung. Doch Agenten haben die Arbeitsweise von Engineering- und technischen Teams grundlegend verändert. Aus diesem Grund freuen wir uns, dieses Jahr auf dem DAIS die Unterstützung von Genie Code für den gesamten ML-Lebenszyklus anzukündigen.
Die Entwicklung und der Betrieb von ML-Modellen erfordern nuancierte Entscheidungen, die generische Coding-Agenten nicht treffen können. Kann ich mich auf die Aktualität und Qualität dieses Datensatzes als Feature verlassen? Führt dieses Feature dazu, dass zukünftige Informationen in das Modell einfließen? Beginnt dieser Serving-Endpunkt zu driften? Die Details im ML-Bereich richtig hinzubekommen, erfordert tiefen Kontext, und dieser Kontext entsteht nur durch eine enge Integration mit der Daten- und ML-Plattform: Ihre Daten und deren Qualität, Feature-Lineage, Experimenthistorie, Trainingsinfrastruktur und Produktionsleistung.
Hier kommt Genie Code ins Spiel:
Und so können Ihre ML-Teams mit Genie Code schneller agieren als je zuvor.
Genie Code übernimmt das Feature Engineering so, wie es Ihr Senior ML Engineer tun würde – es lernt die bestehenden Muster Ihres Teams, verwendet bewährte Transformationen wieder und erstellt Features, die konsistent mit dem sind, was bereits in der Produktion läuft.
Genie Code schreibt nicht nur ML-Code – es trainiert und optimiert produktionsreife Modelle. Es wählt und konfiguriert automatisch die richtige Infrastruktur, sei es CPU für einfache Experimente oder GPU für verteiltes Training, und protokolliert jeden Durchlauf nativ in MLflow.
Genie Code bringt Modelle in einem einzigen Ablauf vom Notebook in die Produktion – von der Registrierung im Unity Catalog über die Bereitstellung an einem Serving-Endpunkt bis hin zur lückenlosen Einhaltung der Governance bei jedem Schritt.
Genie Code hat meine Arbeitsweise komplett verändert. Ich führe täglich mehr als 15 parallele Threads aus, die auf verschiedene Notebooks und Assets ausgerichtet sind, und all das über verschiedene Tabs hinweg zu verwalten, ist einer der größten Reibungspunkte in meinem Workflow. Eine Vollseiten-Ansicht von Genie Code mit gleichzeitigen Sitzungen würde mir eine echte Arbeitsumgebung bieten, um alles parallel auszuführen, ohne ständig den Kontext zu verlieren.—Moritz Schiek, Solution Consultant, Bosch
Mit Genie Code sind wir in 90 Minuten von Rohdaten zu einem kontrollierten, produktionsreifen ML-Workflow gelangt. Da es produktionsreife ML-Workflows auf Databricks auf einzigartige Weise versteht, hat es uns geholfen, Delta-Tabellen zu erstellen, die Daten zu untersuchen, Modelle zu trainieren und zu vergleichen, sie in MLflow und Unity Catalog zu registrieren und das Champion-Modell an einem Serving-Endpunkt bereitzustellen – und es blieb sogar noch Zeit, um das wichtigste Geschäftsergebnis zu optimieren.—Radu Dragusin, Principal Engineer, Data & AI, Danfoss
Um mehr über Genie Code zu erfahren, legen Sie bitte hier los!
GPUs treiben die fortschrittlichsten AI-Workloads von heute an – von Prognosen und Empfehlungen bis hin zu multimodalen Foundation-Modellen. Doch Deep-Learning-Teams haben oft Mühe, GPU-Infrastruktur zu beschaffen und zu verwalten, verteilte Trainingsumgebungen zu konfigurieren und Leistungsengpässe zu beheben. Sie möchten sich lieber auf die Modellierung statt auf die Infrastruktur konzentrieren.
Im März haben wir eine Preview von AI Runtime veröffentlicht, und heute freuen wir uns, im Rahmen des Data AI Summit bekannt zu geben, dass AI Runtime jetzt hochperformantes Multinode-Training unterstützt. Mit AI Runtime haben Databricks-Benutzer nun Zugriff auf:
Mit dieser Einführung können Databricks-Kunden nun dieselbe GPU-Plattform auf Forschungsniveau nutzen, die unser eigenes Team für das Training von Foundation-Modellen wie DBRX und KARL verwendet hat. Heute treibt AI Runtime wegweisende Workloads für Hunderte von Databricks-Kunden an und hilft dabei, modernste AI aus der Forschung in produktive Unternehmensanwendungen zu bringen.

Binden Sie serverlose A10- und H100-GPUs mit 2–3 Klicks an Ihr Notebook an. Keine Clusterverwaltung erforderlich; zahlen Sie nur für das, was Sie tatsächlich nutzen.

Nutzen Sie Genie Code, um Leistungsengpässe zu beheben, mit neuen Architekturen zu experimentieren oder knifflige Fehler bei der Modellkonvergenz oder kryptische Framework-Fehler zu beheben.

AI Runtime ist eine produktionsreife Plattform für beschleunigtes Computing. Entwickeln Sie Ihren Deep-Learning-Code in interaktiven Notebooks und nutzen Sie dann die volle Leistung von Lakeflow, um Jobs auf GPU-Compute-Ressourcen zu übermitteln und zu orchestrieren.
Die AI Runtime von Databricks hat den Prozess des Trainierens eines benutzerdefinierten Text-To-Formula (TTF)-Modells erheblich rationalisiert. Ohne Infrastruktureinrichtung oder Verzögerungen war es einfach, die passende Compute-Ressource basierend auf der Prompt-Größe und der Generierung von Output-Token auszuwählen. Dadurch konnten wir schnell agieren, unsere Lakehouse-Workflows beibehalten und ein qualitativ hochwertiges Modell mit vollständiger Governance bereitstellen, was die Zeit für Einrichtung, Training und Bereitstellung unseres Modells von Tagen auf Stunden verkürzte.—Nikhil Sunderraj, Principal Machine Learning Engineer, FactSet Research Systems, Inc.
Um mit dem Training Ihres nächsten Modells auf GPUs zu beginnen, lesen Sie bitte unsere Beispiele und Dokumentation hier!
Die wirkungsvollsten Machine-Learning-Anwendungen arbeiten in Echtzeit: Sie liefern Empfehlungen in Millisekunden, stoppen betrügerische Transaktionen, bevor sie genehmigt werden, und liefern Suchergebnisse, die sich verzögerungsfrei anfühlen.
Die Bereitstellung eines Modells in der Produktion ist ein empfindliches Gleichgewicht: Jede Anfrage muss innerhalb weniger Millisekunden abgeschlossen sein, selbst bei Traffic-Spitzen – aber Ihre Kosten sollten niedrig bleiben, wenn der Traffic ruhig ist. Dieses Gleichgewicht im großen Stil zu halten, war in der Vergangenheit ebenso schwierig wie die Erstellung des Modells selbst. Bei hohen QPS wird die Serving-Infrastruktur zum Engpass. Die Latenz wird unvorhersehbar, die Kosten steigen und Teams belasten ihre besten Engineers damit, bei jeder Änderung eines Modells oder seines Traffics Replikatanzahlen, Concurrency-Limits und Autoscaling-Schwellenwerte neu anzupassen.
Auf dem Data + AI Summit kündigen wir neue Funktionen an, die diese Last beseitigen – und die Bereitstellung mit geringer Latenz und hohen QPS auf Databricks optimieren:
Kunden, die Databricks Model Serving nutzen, haben ihre Infrastrukturkosten im Vergleich zu selbstverwalteten Stacks um bis zu über 90 % gesenkt, die p99- und p50-Latenz um das Doppelte verbessert und im Produktionsbetrieb mit minimalem bis gar keinem Wartungsaufwand über 100.000 QPS erreicht – und das alles bei Zuverlässigkeit und Verfügbarkeit auf Enterprise-Niveau. Führende ML-Teams wie Grammarly, GoGuardian und Tausende andere Kunden verlassen sich auf Databricks, um ihre Echtzeit-ML-Systeme bereitzustellen.
Probieren Sie diese neuen Funktionen für Ihr nächstes AI-Modell aus! Erfahren Sie mehr in der Dokumentation oder in unseren ausführlichen Walkthrough-Blogbeiträgen:
Erleben Sie die AI Platform in Aktion und erfahren Sie auf dem Data + AI Summit 2026, wie führende Unternehmen AI-Modelle im großen Stil entwickeln und bereitstellen.
(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag
Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.