Direkt zum Hauptinhalt

Jefferies modernisiert die Aktienanalyse in großem Umfang mit Databricks und agentenbasierten Analytics.

Wie Jefferies hunderten von Analysten durch AI/BI Genie einen natürlichsprachlichen Zugriff auf Recherche aus mehreren Quellen ermöglicht.

Databricks and Jefferies logos

Veröffentlicht: 2. März 2026

Kunden11 min Lesezeit

Summary

  • Jefferies nutzt Databricks AI/BI Genie und agentenbasierte Analytics, um mehr als 250 Analysten bei der Beantwortung offener Recherchefragen über mehrere Datenquellen hinweg zu unterstützen.
  • Komplexe Recherchen, die einst Tage oder Wochen dauerten, werden jetzt in Minuten abgeschlossen, wobei die Geschwindigkeit von Self-Dienst mit integriertem Fachwissen kombiniert wird.
  • Direkt auf Databricks aufgebaut und durch Unity Catalog verwaltet, skaliert die Lösung global, ohne Daten, Tools oder Zugriffskontrollen zu duplizieren.

Aktienanalyse ist ein Spiel aus Breite und Überzeugung.

Bei Jefferies deckt die globale Aktienanalyseorganisation rund 3.500 Unternehmen aus verschiedenen Sektoren und Regionen ab, mit Analysten in den USA, EMEA und APAC. Diese Scale ist ein Wettbewerbsvorteil, schafft aber auch eine bekannte Herausforderung für jede Forschungsorganisation, die mit einer wachsenden Zahl von externen und internen Datasets arbeitet.

„Unsere Analysten müssen Signale aus einem riesigen Universum von Unternehmen, Branchen und Datenquellen zusammenführen“, so Ethan Geismar, Head of Data & AI, Equity Research bei Jefferies. „Unser Ziel ist es, ihnen zu helfen, diese Komplexität in eine differenzierte und umsetzbare Anlageberatung für unsere Kunden umzuwandeln.“

Die Fragen, die Analysten stellen, sind selten eng gefasst oder vorschreibend. Sie sind offen, domänenspezifisch und in der Sprache von Märkten und Fundamentaldaten formuliert, nicht in Bezug darauf, welches Dataset abzufragen oder welche Tabelle zu joinen ist. Zum Beispiel stellen Analysten Fragen wie: „Wie sehen die Nachfrage und die Aussichten für Fast-Casual-Restaurants aus?“ oder „Wie entwickeln sich die Besucherzahlen und App-Downloads bei den Marken, die ich abdecke?“ 

In einem Bereich, in dem Investitionsentscheidungen von Vertrauen abhängen, ist ein einziges Signal selten ausreichend. Analysten benötigen eine Bestätigung aus mehreren unabhängigen Quellen, um Überzeugung aufzubauen.

In den letzten Jahren hat das Engineering-Team für Aktienanalyse von Jefferies eng mit Databricks zusammengearbeitet, um Dutzende strukturierter Datensätze aufzunehmen, zu bereinigen und zu standardisieren – von denen viele ursprünglich als alternative Daten begannen, aber mittlerweile Finanz-, Markt- und makroökonomische Indikatoren umfassen. Als die generativen KI-Funktionen ausgereifter wurden, machte sich das Team daran, eine neue Frage zu beantworten:

Wie könnte Jefferies Analysten eine schnellere und einfachere Möglichkeit bieten, diese Daten zu untersuchen – eine, die Governance beibehielt, sich direkt in die bestehende Dateninfrastruktur integrieren ließ und Fragen in natürlicher Sprache in belastbare, quellenübergreifende Analysen umwandelte?

Um dieses Problem zu lösen, hat Jefferies die Jefferies Data Intelligence (JDI) entwickelt – eine dialogorientierte Analyseumgebung, die auf dem Databricks AI/BI Genie basiert und es Analysten ermöglicht, offene Recherchefragen direkt an kontrollierte Multi-Source-Datasets zu stellen.

Die Grenzen von traditionellem Self-Dienst und White-Glove-Support

In der Vergangenheit hat Jefferies neue und Ad-hoc-Anfragen von Analysten auf zwei primäre Arten unterstützt.

Erstens durch herkömmliche Self-Service-Tools zum Durchsuchen von Daten, die den Analysten direkten Zugriff auf Datasets ermöglichten, aber von ihnen verlangten, die zugrunde liegende Datenlandschaft und die Tools zu verstehen, um aussagekräftige Erkenntnisse zu gewinnen.

Zweitens übersetzte das Research-Engineering-Team im Rahmen eines erstklassigen internen Dienstleistungsmodells die Fragen der Analysten in Datenabrufe und lieferte synthetisierte Ergebnisse.

„Auch nachdem wir die Daten bereinigt und zugeordnet haben, gibt es immer noch Reibungsverluste: Jemand muss die grundlegenden Fragen, die Analysten stellen, in die richtigen Datasets und die richtigen Ansichten übersetzen“, erklärte Geismar. „Analysten formulieren ihre Fragen nicht in Form von Tabellen und Joins, sondern zu Fundamentaldaten, Makroökonomie, Branchentrends, vergleichender Positionierung, Katalysatoren, Risiken usw.“

Obwohl dieser Ansatz leistungsstark ist, brachte er eine andere Einschränkung mit sich: die Bandbreite des Teams.

„Wir arbeiten in monatlichen Sprints, und der Spielraum für kurzfristige Anfragen ist begrenzt“, sagte Geismar. „Selbst wenn eine Aufgabe technisch nicht anspruchsvoll war, dauerte es aufgrund von Kapazitätsengpässen in manchen Fällen Tage oder sogar Wochen, bis wir sie in Angriff nehmen konnten.“

Komplexere Fragen, insbesondere solche, die eine Triangulation über mehrere Datasets hinweg erfordern, konnten nach der Priorisierung Stunden oder Tage konzentrierter Arbeit in Anspruch nehmen.

Komplexe Recherchefragen waren oft die größte Herausforderung. Ein Analyst, der nach Trends der Verbrauchernachfrage in Fast-Casual-Restaurants fragte, benötigte möglicherweise Besucherfrequenzdaten, Interaktionsmetriken für mobile Apps, umfragebasierte Kaufabsichten und makroökonomischen Kontext – allesamt separate Datenabfragen, Joins und Analysen.

Beide Modelle funktionierten, verursachten aber auch Reibungsverluste. Was Jefferies brauchte, war eine Möglichkeit, die Unabhängigkeit des Self-Service mit der eingebetteten Expertise des Research-Engineering-Teams zu kombinieren, ohne neue Engpässe zu schaffen.

Ein Research Agent, der Analysten dort abholt, wo sie sind

Um dies im großen Maßstab zu operationalisieren, entwickelte Jefferies einen internen Assistenten für die Aktienanalyse mit einer maßgeschneiderten Schnittstelle für Analysten, der von AI/BI Genie als Orchestrierungs- und Reasoning-Engine auf dem strukturierten Data Lake des Unternehmens aufsetzt.

Die daraus resultierende Erfahrung ermöglicht es Analysten, die gleichen Fragen zu stellen, die sie einem Fachexperten stellen würden, und Antworten zu erhalten, die auf mehreren relevanten Datensätzen basieren. Wichtig ist, dass das System die Sprache versteht, die Analysten bereits zur Formulierung ihrer Recherchen verwenden.

Wenn ein Analyst beispielsweise nach Fast-Casual-Restaurants fragt, interpretiert AI/BI Genie diese Branchenkurzbezeichnung mithilfe von domänenspezifischen semantischen Zuordnungen und kuratiertem Geschäftskontext, ordnet sie dem entsprechenden Abdeckungsuniversum zu und ruft relevante Daten ab, ohne dass der Analyst Marken, Tabellen oder Joins angeben muss.

Dieselben Coverage-Mappings, die darauf abgestimmt sind, wie Analysten ihre Sektoren auf natürliche Weise segmentieren und mit Branchentaxonomien übereinstimmen, ermöglichen aggregierte Ansichten wie die gesamten Restaurantbesuche über die zugehörigen Marken hinweg. Da diese Logik direkt in Genie integriert ist, können Analysten ihre Coverage mithilfe vertrauter Sprache und Gruppierungen abfragen.

Von dort aus können Analysten auf natürliche Weise iterieren, indem sie Aufschlüsselungen auf Markenebene anfordern („Schlüsseln Sie dies nach einzelnen Marken auf“), Aggregationen von Muttergesellschaften oder zusätzlichen Kontext, was tiefere Analysen ermöglicht, ohne dass diese Dimensionen im Voraus festgelegt werden müssen.

Wo offene Fragen verborgene Erkenntnisse aufdecken

Wenn Analysten mit offenen Prompts interagieren, hilft das System dabei, die für die jeweilige Frage relevantesten Signale zu identifizieren und deckt dabei oft Erkenntnisse und Datensätze auf, die Analysten möglicherweise zuvor nicht berücksichtigt hätten.

Eine einfache Abfrage wie „Zeige mir die Besucherzahlen von Fast-Casual-Restaurants“ ruft zugehörige Daten zur Besucherfrequenz ab und präsentiert eine Trendanalyse.

Aber allgemeinere Prompts wie „Zeig mir die Nachfrage und die Aussichten für Fast-Casual-Restaurants“ erweitern den Analyseumfang, indem sie Kundenfrequenz, Nutzung von mobilen Apps, umfragebasierte Kaufabsichten, makroökonomische Indikatoren und andere Signale zusammentragen.

Abbildung: Jefferies Data Intelligence beantwortet eine Frage zu öffentlichen Daten mithilfe von regulierten Datasets und Live-APIs von FRED/BLS
Jefferies Data Intelligence answering a multi-source research question with natural-language synthesis and generated visualizations.

„Es gibt Analysten nahtlosen Zugriff auf unsere Daten, ohne dass sie technisches Wissen oder Support benötigen“, sagte Geismar. „Aber der noch größere Mehrwert besteht darin, dass es ihnen Daten zugänglich macht, von deren Existenz sie nichts wussten oder an deren Verwendung sie für die von ihnen gestellte Frage nicht gedacht hätten.“

Diese Antwort aus mehreren Quellen bringt analytische Blickwinkel zum Vorschein, die Analysten möglicherweise nicht explizit angefordert haben, und ermöglicht so die Bestätigung durch unabhängige Quellen.

Diese Bestätigung, so Geismar, ist das zentrale Nutzenversprechen. „Die Stärke liegt darin, mehrere unabhängige Datensätze zusammenzuführen, um eine These zu untermauern“, fügte er hinzu. „Es gibt keine Redundanz – es geht darum, die Überzeugung zu stärken. Das ist das A und O.“

Umgekehrt, wenn die Ergebnisse den Annahmen widersprechen, stoßen sie neue Forschungsrichtungen an und helfen dabei, Anlagestrategien zu verfeinern.

So funktioniert es: Ein agentenbasierter Workflow auf Basis von Databricks

Die Analystenerfahrung wirkt gesprächsartig, aber die dahinterstehende Infrastruktur ist hochentwickelt. Unter der Haube wird die Anwendung von einer LangGraph-basierten Multi-Agenten-Architektur angetrieben, die durch Databricks Model Serving operationalisiert wird.

Wenn ein Analyst eine Frage einreicht, folgt das System einem strukturierten Workflow:

  1. Tool-Validierung stellt sicher, dass die erforderlichen Datendienste und APIs verfügbar sind, und überprüft dabei sowohl interne Databricks-Ressourcen als auch Dienste von Drittanbietern wie Federal Reserve Economic Data (FRED), das Bureau of Labor Statistics (BLS) und andere.
  2. Ein Planungs-Agent zerlegt die Frage in eine Reihe von Recherche-Tasks und erstellt einen Plan dafür, was recherchiert werden muss und wie die verfügbaren Tools für eine umfassende Antwort zu verwenden sind.
  3. Ausführungs-Agents rufen Daten, wo möglich, parallel ab, wobei sie über Genie auf verwaltete Datasets zugreifen und bei Bedarf Drittanbieter-APIs nutzen. Diese Agents folgen der Reihenfolge des Research-Plans und führen Aufgaben sequenziell aus, wenn Abhängigkeiten bestehen, und parallel, wenn dies möglich ist.
  4. Ein Synthese-Agent stellt die Ergebnisse zu einer kohärenten Antwort zusammen, die oft Diagramme und Analysen enthält, welche Erkenntnisse aus mehreren Quellen kombinieren.

Entscheidend ist, dass das System als Reaktion auf eine einzige Frage Signale über mehrere Datasets hinweg abrufen und bestätigen kann, was eine datasetübergreifende Bestätigung ermöglicht, anstatt sich auf eine einzelne Tabelle oder eine einzige verbundene Ansicht zu verlassen. Diese Architektur ermöglicht es Analysten, mit natürlichen Folgefragen zu iterieren, wie z. B. Aufschlüsselungen nach Ticker-Symbolen oder Marken, um Signale zu validieren und Details zu untersuchen.

Innerhalb dieses Workflows spielt Genie eine Schlüsselrolle, indem es Fragen in natürlicher Sprache über kuratierte, verwaltete Geschäftsdaten ermöglicht, während Databricks Model Serving die Deployment- und Serving-Schicht für die JDI-Anwendung bereitstellt.

Das System ist modellunabhängig und nutzt eine Reihe von Foundation Models für schlussfolgerungsintensive Tasks wie Planung und Synthese, während es die Flexibilität beibehält, bei der Weiterentwicklung der Architektur schlankere oder aufgabenspezifische Modelle für einfachere Schritte (wie die Tool-Validierung) zu integrieren.

Für das Team, das JDI entwickelt, signalisiert diese Architektur einen umfassenderen Wandel in der Art und Weise, wie Aktienanalysen zukünftig durchgeführt werden.

„Der Aufbau von Jefferies Data Intelligence mit Databricks hat uns wirklich einen Einblick gegeben, wie die Zukunft der Forschung aussehen wird“, erklärte Dylan Andrews, ein Senior Associate Data Scientist im Equity Research Team. „Die Syntax für die Interaktion mit Daten zu kennen, wird immer weniger wichtig sein, und der Fokus wird mehr darauf liegen, Hypothesen zu verifizieren oder zu widerlegen, die auf einem Mosaik von Daten aus verschiedenen Bereichen basieren – und das innerhalb von Minuten.“

Governance by Default mit Unity Catalog

Eine der wichtigsten Anforderungen für Jefferies war sicherzustellen, dass Governance nicht erst im Nachhinein berücksichtigt wurde.

Da Datensätze über den Databricks Unity Catalog registriert und abgerufen werden, werden Zugriffskontrollen automatisch basierend auf der Benutzeridentität durchgesetzt. Genie berücksichtigt dieselben Berechtigungen auf Tabellen-, Zeilen- oder Spaltenebene, die bereits im Unity Catalog definiert sind, wodurch die Notwendigkeit entfällt, eine benutzerdefinierte Autorisierungslogik für das KI-Erlebnis zu erstellen und zu pflegen.

Dies ermöglichte die sichere Erweiterung leistungsstarker Analysefunktionen auf nicht-technische Benutzer, ohne die Datensicherheit oder Compliance zu beeinträchtigen. Da das System für sensiblere Datasets und einen breiteren, globalen Benutzerzugriff skaliert wird, stellen diese integrierten Governance-Kontrollen automatisch sicher, dass die richtigen Personen die richtigen Daten sehen.

Webinar

Databricks 101: Eine praktische Einführung

Aufbauend auf bestehender Dateninfrastruktur

Der Agent für die Aktienanalyse wurde nicht als eigenständiger KI-Prototyp entwickelt. Er wurde so konzipiert, dass er direkt auf der Datengrundlage aufbaut, die Jefferies in siebenjähriger Partnerschaft bereits auf Databricks aufgebaut hatte.

Heute greift das System auf mehrere Quellen in einer hybriden Architektur zurück, die verwaltete Databricks-Datasets mit Laufzeit-API-Aufrufen kombiniert:

Genie Spaces (kuratierte Datasets):

  • Fundamentaldaten: Vom Unternehmen gemeldete Finanz- und Betriebsmetriken, die während der vierteljährlichen Gewinnzyklen veröffentlicht werden, einschließlich unternehmensspezifischer KPIs
  • Alternative Datasets: Web-Traffic, Besucherfrequenz, Social-Media-Engagement und mehr, vorab zusammengefügt und bereit für die Kreuzanalyse

Laufzeit-API-Verbindungen:

  • Makroökonomische Daten: Indikatoren von FRED und dem BLS.
  • Andere Drittanbieterdienste und APIs: Zusätzliche Datenquellen von Drittanbietern, die nicht vorab bereitgestellt und besser zur Laufzeit über API oder MCP aufgenommen werden.

Der Agent verbindet nahtlos Daten aus API-Aufrufen mit verwalteten Datasets, die über Genie abgerufen werden, und liefert so umfassende Antworten, die sowohl externe Echtzeitdaten als auch sorgfältig kuratierte interne Quellen umfassen.

Da der Assistent dieselben bereits vorhandenen Ingestion-Pipelines, Orchestrierungs-Jobs und Governance-Modelle nutzt, konnte Jefferies agentenbasierte Funktionen auf seine bestehende Infrastruktur aufsetzen, anstatt ein paralleles System einzuführen. Die auf Databricks ausgeführten Orchestrierungs-Jobs, die die Ingestion, Bereinigung und Standardisierung über bestehende Databricks-Pipelines abwickeln, bilden weiterhin die Grundlage, die nun über natürliche Sprache zugänglich ist.

Tamar Kellner, Senior Associate Data Scientist im Equity-Research-Team, betonte, wie die nativen Funktionen von Databricks die Entwicklung beschleunigten:

„Databricks Genie und Model Serving übernahmen von Haus aus den Datenzugriff, die Bereitstellung und die Governance, sodass sich unser Team auf die wichtigsten Alleinstellungsmerkmale von JDI konzentrieren konnte: agentenbasiertes Systemdesign, analystenzentrierte Workflows und schnelle, datensatzübergreifende Signal-Bestätigung.“

Vertrauen durch Transparenz schaffen

Die Akzeptanz erforderte mehr als nur Geschwindigkeit. Analysten mussten den Ergebnissen vertrauen können, insbesondere in einem Workflow ohne menschlichen Vermittler.

Eine der entscheidenden Herausforderungen, die das Team löste, war: Wie sorgen wir dafür, dass nicht-technische Benutzer sich mit KI-generierten Ergebnissen wohlfühlen und ihnen vertrauen? Im Gegensatz zu Tools, die auf unstrukturierten Daten basieren, konnte das Team nicht einfach auf die Quelldokumente zurückverweisen und hervorheben, woher die Informationen stammten. Ebenso wenig konnten sie von den Analysten erwarten, SQL-Abfragen zu validieren, um die Korrektheit zu überprüfen.

Die Lösung bestand darin, die Überprüfbarkeit direkt in jede Antwort zu integrieren. Jede von JDI zurückgegebene Antwort enthält ein erweiterbares Dropdown-Menü mit einer „Chain-of-Thought“-Ansicht, die nachvollziehbar macht, wie das System den Prompt des Analysten in Datenextraktionsaufrufe übersetzt hat. Diese Transparenz hilft nicht-technischen Benutzern, den Entscheidungsprozess zu verstehen und zu überprüfen, und schafft Vertrauen in die Ergebnisse, ohne dass sie SQL oder Quelltabellen direkt prüfen müssen.

Diese Erklärbarkeit, kombiniert mit der Fähigkeit des Systems, mehrere bestätigende Datasets aufzuzeigen, gibt Analysten die Beweise, die sie benötigen, um Vertrauen in ihre Anlageempfehlungen aufzubauen.

Erste Auswirkungen und nächste Schritte

Der Assistent ist derzeit für mehr als 250 Nutzer in den USA ausgerollt, und es ist geplant, ihn auf EMEA und APAC auszuweiten, sodass weltweit insgesamt etwa 550 Analysten Zugriff haben werden.

Obwohl das Tool erst seit wenigen Wochen live ist, wird es bereits breit angenommen. Hunderte von Fragen wurden bereits beantwortet und dabei Tausende von Einblicken und Diagrammen generiert.

Arbeiten, die zuvor aufgrund von Bandbreitenbeschränkungen oder ihrer Komplexität Tage oder Wochen dauerten, werden jetzt in Minuten erledigt.

Für Benutzer wie Kaumil Gajrawala, Managing Director of Consumer Research bei Jefferies, verändert diese Beschleunigung bereits die Art und Weise, wie die Recherche durchgeführt wird.

„JDI hat unseren Workflow massiv beschleunigt“, sagte Gajrawala. „Wir erledigen mehr, schneller. „Wir haben erst an der Oberfläche gekratzt. Wir entwickeln uns von der reinen Beschleunigung unserer Arbeit hin zur Entdeckung neuer Möglichkeiten, die uns bisher nicht zur Verfügung standen.“

Das aktuelle System greift auf etwa 10–12 Kerndatenquellen zurück, von denen einige mehrere Datasets enthalten, mit einem klaren Plan für die Erweiterung auf über 30–40 Quellen im Laufe der Zeit.

„Wir starten mit den gängigsten Quellen, aber wir haben ein Ausbaupotenzial für zwei- bis dreimal so viele“, sagte Geismar. „Die Vision ist, dass dies zum einzigen Zugangspunkt für die strukturierten Daten unserer Abteilung und zu einem täglichen Werkzeug für die meisten Analysten wird.“

Während die Plattform erweitert wird, konzentriert sich Jefferies weiterhin auf die Aufrechterhaltung von Performance, Benutzerfreundlichkeit und Interpretierbarkeit und vergrößert gleichzeitig die Breite der zugänglichen Recherchedaten.

Ein neuer Zugangspunkt für die Aktienanalyse

Indem Jefferies auf den Data-Engineering-, Governance- und KI-Funktionen von Databricks aufbaut, entwickelt das Unternehmen die Art und Weise weiter, wie Analysten mit strukturierten Daten interagieren, und kombiniert dabei die Autonomie von Self-Service mit der eingebetteten Expertise des Research-Engineering-Teams.

Das Ergebnis sind nicht nur schnellere Antworten, sondern ein System, das Analysten dabei hilft, stärkere, besser vertretbare Investmentthesen zu entwickeln, die auf bestätigten Beweisen beruhen und in der von der Recherche geforderten Geschwindigkeit geliefert werden.

 

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Verpassen Sie keinen Beitrag von Databricks

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Was kommt als Nächstes?

Databricks Named a Leader in 2024 Gartner® Magic Quadrant™ for Cloud Database Management Systems

Notícias

23. Dezember 2024/8 min Lesezeit

Databricks nomeada líder no Quadrante Mágico da Gartner® de 2024 para sistemas de gerenciamento de banco de dados em nuvem

Zerobus Ingest diagram

Anúncios

30. Oktober 2025/7 min Lesezeit

Anunciando a prévia pública do Zerobus Ingest