Direkt zum Hauptinhalt

Wie Databricks Baseballteams hilft, mit Daten & KI einen Vorsprung zu erzielen

Pitch-Daten in Entscheidungen im Dugout umwandeln mit Unity Catalog, Agent Bricks und Lakebase

How Databricks Helps Baseball Teams Gain an Edge with Data & AI

Veröffentlicht: 24. März 2026

Medien und Unterhaltung7 min Lesezeit

Summary

  • Wie ein Baseball-Club KI nutzt: Was der Schlagtrainer, Pitching-Coach, Manager und GM einen zustandsabhängigen Assistenten in realen Situationen fragen.
  • Welche Databricks-Produkte jeden Moment antreiben: Genie für Vorbereitungs- und Front-Office-Arbeit, Agent Framework und Model Serving am Spieltag, Unity Catalog und Vector Search im Hintergrund und Lakebase Postgres für zustandsbehaftete Apps.
  • Warum eine Plattform wichtig ist: Dieselben gesteuerten Daten und Tools treiben Echtzeitentscheidungen, Scouting-Berichte und Kaderstrategien an, ohne CSVs oder einmalige Skripte.

Baseball bewegt sich schnell, definiert durch kleine Momente: ein Wurf, ein Duell, eine Entscheidung. Diese Geschichte verfolgt, wie ein modernes Clubhaus Databricks nutzt, um hochauflösende Pitch-Daten in Entscheidungen umzuwandeln, die helfen, Spiele zu gewinnen.

Databricks für Baseball

Spieltag, 14:00 Uhr

Hitter-Meeting mit Genie und Unity Catalog

Die Hitter strömen in den Videoraum. Der Trainer möchte keinen 30-seitigen Ausdruck; er möchte einen klaren Plan für den heutigen Starter.

Früher am Tag saß der Analyst an seinem Laptop und öffnete Genie, aufbauend auf Unity Catalog, wo Statcast- und teamgenerierte Tabellen mit konsistenten Schemata, Berechtigungen und Abstammung liegen. Er fragte:

„Zeige mir für den heutigen Starter die erste Pitch-Mischung und die Positionen für unsere Rechts- und Linkshänder in den letzten beiden Saisons. Hebe Trends hervor, wenn Läufer auf den Bases sind.“

Genie stellte die Antwort aus verwalteten Delta-Tabellen in Unity Catalog zusammen. Als Teil dieser Arbeit registrierte der Analyst auch eine Reihe von Unity Catalog SQL-Funktionen, die die wichtigsten Abfragen kapseln, wie z. B. Tendenzen nach Zählungen, Händigkeit und Basenläuferstatus, damit er sie in zukünftigen Planungen und in automatisierten Agenten wiederverwenden kann.

Der Analyst exportierte die Ergebnisse in ein einfaches Einseiter, das das Personal ausdrucken oder in die Hitter-Binder aufnehmen konnte. Die wichtigsten Punkte waren:

  • Rechtshänder: hohe Cutter und Four-Seamer früh, besonders wenn die Bases leer sind.
  • Linkshänder: mehr Change-ups und Sinker, wenn ein Läufer auf der zweiten Base ist.
  • Zwei Strikes: Slider tief und außen erscheint bei den meisten großen Strikeouts.

Der Schlagtrainer betritt das Meeting mit drei klaren Diskussionspunkten. Bis die Spieler zum Batting Practice gehen, sind die ersten beiden Durchgänge der Reihenfolge keine Vermutungen mehr; sie basieren auf einer gemeinsamen Sichtweise, wie der heutige Starter tatsächlich wirft.

Vorbereitung des Bullpens vor der Serie

Pitching-Änderungen mit Agent Framework und Model Serving skripten

Das Personal weiß, dass es in den meisten Spielen einen Punkt geben wird, an dem der Starter fast 100 Pitches hat und die Mitte der Reihenfolge kommt. Die Wahl zwischen einem Sinkerballer und einem Slider-ersten Rechtshänder wird sich im Moment wie eine Bauchgefühl-Entscheidung anfühlen, aber die Arbeit findet früher statt.

Vor der Serie im Clubhaus nutzt der Analyst einen Multi-Agent Supervisor, der mit Agent Bricks erstellt und auf Model Serving bereitgestellt wurde, um die für das Personal wichtigen Situationen zu simulieren: Mitte der Reihenfolge im sechsten Inning, unteres Drittel im siebten Inning, linkshänderlastige Cluster in den späten Innings.

Für jede Entscheidung:

  1. löst der Agent die Namen der relevanten Hitter mit einer Lookup-Funktion in Unity Catalog in IDs auf.
  2. ruft er UC SQL-Funktionen auf, die Pitch-Typ- und Ergebnis-Positionen nach Zählung, Händigkeit und Basenläuferstatus berechnen.
  3. vergleicht er das Arsenal jedes Relievers mit diesem Hitter-Cluster und erklärt, welche Profile am besten funktionieren und warum, in einfacher Baseball-Sprache.

Der Analyst wandelt dies in eine kurze Bullpen-Karte um. Zum Beispiel:

  • „Wenn diese drei Hitter an der Reihe sind und der Starter müde wird, ist der Slider-erste Rechtshänder bevorzugt; hier ist, wie seine Mischung in ähnlichen Situationen funktioniert hat.“
  • „Wenn das untere Drittel an der Reihe ist, gewinnt das Ground-Ball-Profil des Sinkerballers öfter; hier sind die Beweise.“

Das Personal druckt die Karte aus und bespricht sie gemeinsam. Wenn die tatsächliche Situation im sechsten Inning während des Spiels eintritt, loggt sich niemand in Databricks ein. Der Pitching-Trainer folgt einem Entscheidungsbaum, den das Personal bereits Stunden zuvor mit dem Agenten unter Druck getestet hat.

Offensive in den späten Innings

Planung von Pinch-Hit-Entscheidungen mit demselben Agenten und denselben Tools

Pinch-Hit-Entscheidungen im achten Inning werden auf die gleiche Weise geübt.

Als Teil der Vorbereitung vor dem Spiel fragt der Analyst den Databricks-Agenten:

„Ranke für die wahrscheinlichen Reliever in den späten Innings, die wir in dieser Serie sehen werden, unsere Bank-Bats nach erwartetem Ergebnis und erkläre, wann jeder die bessere Option ist.“

Der Agent ruft dieselben UC-Funktionen und Delta-Tabellen in Unity Catalog auf, um:

  • das Nutzungsmuster jedes Relievers mit den Ergebnissen jedes Bank-Hitter nach Pitch-Typ, Position und Zählung zu kombinieren.
  • wahrscheinliche späte Spielszenarien zu simulieren, wie z. B. Läufer auf der ersten und zweiten Base, ein Aus, gegen einen rechtshändigen Reliever, der auf Cutter setzt.
  • klare Anleitungen zu erstellen, wie z. B.: „Gegen Reliever X schneidet Hitter A mit Läufern auf besser ab, während Hitter B besser in leeren Bases passt, wenn er auf Sinker setzt.“

Der Analyst fügt diese Empfehlungen in die Spielkarte des Managers oder ein kleines Einseiter-„Pinch-Hit-Raster“ ein, das im Voraus überprüft werden kann. Sobald das Spiel beginnt, wird die Karte zum Referenzpunkt. Der Manager wählt zwischen Optionen, die er bereits durchgesprochen hat, wobei die Daten in einem Format destilliert sind, das die Ligaregeln bezüglich Geräten im Dugout berücksichtigt.

Bericht

Datenintelligenz gestaltet Branchen neu

Reisetag

Voraus-Scouting mit Vector Search und Unity Catalog

Am freien Tag zwischen den Serien wendet sich der Analyst von der Taktik für ein einzelnes Spiel dem Kommenden zu. Zwei bevorstehende Starter haben nur begrenzte direkte Erfahrungen gegen die Aufstellung.

Zurück in Genie fragt er:

„Finde Pitcher, deren Arsenale und Bewegungsprofile unseren bevorstehenden Startern am ähnlichsten sind, und zeige dann, wie unsere Aufstellung gegen diese vergleichbaren Werfer abgeschnitten hat.“

Hier übergibt Genie einen Teil der Arbeit an Databricks Vector Search. Pitcher- und Hitter-Embeddings, die aus früheren Verarbeitungen in Unity Catalog gespeichert sind, werden indiziert, damit das System „ähnliche Pitcher“ finden kann, ohne nach Augenmaß zu raten.

Der Workflow ist:

  1. Genie analysiert die Pitch-Mischung und Bewegung der neuen Starter aus Unity Catalog-Tabellen.
  2. Vector Search findet Pitcher mit ähnlichen Pitch-Profilen.
  3. UC SQL-Funktionen berechnen die Aufstellungsergebnisse gegen diese vergleichbaren Pitcher.
  4. Genie fasst die Muster in einem Scouting-Bericht zusammen, den der Schlagtrainer verwenden kann.

Wenn die Head-to-Head-Statcast-Historie dünn ist, gibt diese Kombination aus Vector Search und Genie dem Personal eine Möglichkeit zu sagen: „So haben wir Pitcher getroffen, die so aussehen“, und dies in den Serienplan einzubauen. Diese Erkenntnisse werden dann in den Voraus-Bericht exportiert, bereit für das nächste Auswärtsmeeting.

Front-Office-Tag

GM und Analysten mit Genie, Lakehouse und Lakebase

Gewinnbringende Saisons basieren auf mehr als nur einem Spiel. Der GM und die Analysten nutzen dieselbe Plattform, um Entscheidungen über Wert, Passform und Risiko zu treffen.

In Genie untersuchen sie Fragen wie:

„Zeige, wie das Profil unseres Nummer-Drei-Starters gegen die Top-Aufstellungen unserer Division nach Zählung und Händigkeit abschneidet. Woher kommt sein Wert und wo sind wir exponiert?“

„Identifiziere für Linkshänder-Bats in der gesamten Liga Spieler, deren Stärken mit der Art und Weise übereinstimmen, wie unsere Division in den späten Innings beworfen wird.“

Diese Fragen werden direkt aus dem Lakehouse in Unity Catalog beantwortet. Pitch-Level-Daten, Embeddings und abgeleitete Features sind alle an einem Ort verwaltet. Genie wandelt sie in Antworten in natürlicher Sprache um, aber unter der Haube ist die Logik immer noch wiederverwendbare UC SQL-Funktionen.

Inzwischen wird die Baseball-Operations-App, die Trainer, Scouts und das Front Office nutzen, von Lakebase Postgres unterstützt. Diese App ist der Ort, an dem:

  • Scouts Berichte über potenzielle Handelsziele eingeben.
  • Trainer übergeordnete Entscheidungen markieren, wie z. B. „Slider-erster im sechsten gegen die Mitte der Reihenfolge“, nach dem Spiel.
  • Der GM endgültige Entscheidungen über Trades, Vertragsverlängerungen und Kaderbewegungen festhält.

Da Lakebase Postgres Teil der Databricks-Plattform ist, bleibt der App-Status nahe an den Quelldaten:

  • App-Schreibvorgänge (Berichte, Tags, Entscheidungen) gehen in Lakebase Postgres ein und sind sofort für Analysten und Agenten verfügbar, die Zugriff haben.
  • Geplante Jobs oder Pipelines veröffentlichen kuratierte Ausschnitte von Unity Catalog-Tabellen in Lakebase Postgres, sodass die App-Benutzeroberfläche immer die neuesten Statistiken und Features ohne manuelle CSV-Exporte hat.

Das Ergebnis ist ein gemeinsames Gedächtnis. Was passiert ist, warum es passiert ist und wie es gerechtfertigt wurde, wird an einem Ort mit Zeitstempeln und Benutzeridentität gespeichert.

Warum das Spiele gewinnt

  • Intelligentere Kaderwetten: Spielerbewegungen stimmen mit der Art und Weise überein, wie die Liga beworfen wird, insbesondere in der Division und im Oktober.
  • Hochwertigere Plate Appearances: Hitter wissen, was ein Pitcher in diesem Moment tatsächlich wirft, nicht was er generell wirft.
  • Sauberere Bullpen-Duelle: Die besten Situationen jedes Relievers sind in Sekunden offensichtlich, was das Rätselraten unter Zeitdruck reduziert.
  • Weniger verschwendete Pitches in Drucksituationen: Das Wissen um den entscheidenden Pitch pro Hitter und Zählung reduziert tiefe Zählungen und Freikarten.
  • Bessere Ergebnisse beim ersten Pitch: Angriffsstrategien, die erwartete Entscheidungen umkehren, führen zu frühem Kontakt zu den Bedingungen des Teams.

All of that only matters if the numbers are right. By running these agents and apps on top of a single governed lakehouse instead of scattered one‑off tools, clubs can see that the logic matches the work they already do and lean on it in big spots. When the data points to a specific matchup or move, it feels like an extension of the game plan, not a black box.

Learn more about Databricks Sports, or request a demo to see how your organization can drive competitive insights.

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.