Mit ai_parse_document PDFs direkt in SQL mit führender Qualität zu 3-5x niedrigeren Kosten parsen und verstehen
Während der Week of Agents erweitern wir Agent Bricks, die Databricks-Plattform für den Aufbau von gesteuerten, produktionsreifen KI-Agenten, die präzise auf Ihren Daten schlussfolgern. Eine der größten Herausforderungen für Unternehmen bei der Skalierung von Agenten ist der Zugriff auf unstrukturierte Daten. Fast 80 % des Wissens von Unternehmen sind in PDFs, Berichten und Diagrammen gefangen, die Agenten nicht lesen, verstehen oder verarbeiten können. Diese Dokumente enthalten kritische Kontexte, aber die meisten KI-Agenten konnten sie nicht lesen – bis jetzt.
Bestehende Parsing-Tools stoppen bei der Textextraktion. Sie übersehen die Layouts, visuellen Elemente und Beziehungen, die in echten Dokumenten Bedeutung tragen. Teams verbringen Monate damit, brüchigen benutzerdefinierten Code zu schreiben, der bei realen Daten immer noch versagt. ai_parse_document eliminiert diese Komplexität. Es bringt vollständiges Dokumentenverständnis direkt in die Databricks Data Intelligence Platform und gibt jedem Agenten Zugriff auf die volle Treue Ihres Geschäftskontexts – präzise, sicher und in großem Maßstab.
Mit einem einzigen SQL-Befehl können Organisationen Dokumente in strukturierte, gesteuerte und abfragbare Daten umwandeln:
Das Ergebnis ist nicht nur der Text der PDF, sondern auch Layoutinformationen, analysierte Tabellen, Begrenzungsrahmen, Abbildungen und Bilder mit Bildunterschriften – eine umfassende Beschreibung des Dokuments als strukturierte Information.
"Databricks’ ai_parse_document reduziert den Konfigurationsaufwand, sodass Data Scientists weniger Zeit für die Einrichtung aufwenden und mehr Zeit für die Weiterentwicklung komplexer, kundenorientierter Lösungen aufwenden können."—Meiling He, Sr. Data Science Manager, Rockwell Automation
Im Vergleich zu anderen State-of-the-Art-Parsing-Systemen und Vision-Language-Modellen (VLMs) weist ai_parse_document die höchste Qualität für seine Preisklasse auf, gemessen sowohl an einem gängigen externen Benchmark (OmniOCR) als auch an unserem privaten internen Benchmark (siehe Abbildungen unten). Der interne Benchmark ist besser auf die Verteilung der Dokumente abgestimmt, die wir von Kunden gesehen haben, und es ist auch unwahrscheinlich, dass er Teil der Trainingsdaten eines Modells ist. In den kommenden Wochen werden wir auch unsere neuen OmniOCR-Labels veröffentlichen, die einige Beschriftungsfehler beheben und Begrenzungsrahmen sowie Hierarchieinformationen einführen.
ai_parse_document erfasst Tabellen, Abbildungen und Diagramme mit KI-generierten Beschreibungen und räumlichen Metadaten und speichert die Ergebnisse in Unity Catalog. Ihre Dokumente verhalten sich jetzt wie Tabellen – durchsuchbar über AI Search und nutzbar in Agent Bricks Workflows.