Direkt zum Hauptinhalt

State of Data + AI

Data intelligence and the race to customize LLMs

Wir befinden uns im goldenen Zeitalter von Daten und KI. Das beispiellose Tempo der KI-Entdeckungen, Modellverbesserungen und neuen Produkte auf dem Markt sorgt dafür, dass Daten- und KI-Strategien in allen Unternehmen auf der ganzen Welt an erster Stelle stehen. Die nächste Generation erfolgreicher Unternehmen und Führungskräfte wird diejenige sein, die KI versteht und nutzt.

In unserem Einführungsbericht 2023 State of Data + AI untersuchen wir Trends bei der Einführung von „Daten und KI“ bei mehr als 9.000 globalen Databricks-Kunden. Ziel dieses Berichts ist es, Datenverantwortlichen und Führungskräften dabei zu helfen, das KI-Umfeld zu verstehen und ihre eigenen Dateninvestitionen und -strategien zu bewerten.

2023 State of Data + AI deckt den breiteren Datenbestand ab, um Fragen zu beantworten wie:

  • Wie wenden Unternehmen Data Science und Machine Learning (ML) in der realen Welt an?
  • Welche Daten- und KI-Produkte schaffen es schnell an die Spitze?
  • Wie führen Unternehmen ihr Data Warehousing durch, insbesondere im neuen Zeitalter der KI?

Hier ist eine Zusammenfassung dessen, was wir entdeckt haben:

AI Is in Production

We analyzed the ratio of logged-to-registered models across all customers to assess ML production progress.

 

Production is where the true value of AI is realized, whether a product is for your internal teams or customers. We predict that the growing success in ML helps pave a path to greater success with building production-quality GenAI applications. 

NLP und LLMs

Wichtigste Erkenntnis: NLP (Natural Language Processing, Verarbeitung natürlicher Sprache) und LLM (Large Language Models, große Sprachmodelle) sind sehr gefragt

Unsere Daten zeigen, dass Unternehmen den Wert von ML erkennen und zunehmend in modernste Tools investieren – ein Trend, der durch die jüngsten Innovationen bei LLMs unterstrichen wird. Wir sehen, dass SaaS-LLMs, die für den Zugriff auf Modelle wie OpenAI verwendet werden, parallel zur Einführung von ChatGPT exponentiell wachsen. Tatsächlich ist die Zahl der Unternehmen, die SaaS-LLM-APIs nutzen, zwischen Ende November 2022 und Anfang Mai 2023 um 1310 % gestiegen.

Letztendlich haben wir zwei sich beschleunigende Trends beobachtet: Unternehmen bauen ihre eigenen LLMs auf, die, wie Modelle wie Dolly zeigen, recht schlank und kostengünstig sein können, und sie verwenden proprietäre Modelle wie ChatGPT.

Bericht mit weiteren Erkenntnissen zu LLMs herunterladen

Chart - Use of LLM Python Libraries

Since the Public Preview launch of Databricks Vector Search, the entire vector database category grew 186%, far more than any other LLM Python libraries.

 

The explosion of vector databases indicates that companies are looking for GenAI alternatives that can help with problems or drive opportunities specific to their business. And it suggests that enterprises will likely be relying on a mix of different types of GenAI models throughout their operations.

Der moderne Daten- und KI-Stack

Wichtigste Erkenntnis: Datenintegrationstools dominieren

Eine häufige Frage unserer Kunden lautet: „Welche Daten- und KI-Produkte nutzen andere Unternehmen?“

Wir haben den Einsatz und das Wachstum bei Hunderten von Partnern in unserem Ökosystem analysiert. Unsere am schnellsten wachsenden Produkte erzählen die Geschichte von Unternehmen, die Datenintegrationstools hinzufügen, damit sie schnell komplexere Anwendungsfälle mit ihren Daten entwickeln können. dbt verzeichnet mit einem Anstieg der Kundenzahl um 206 % gegenüber dem Vorjahr das höchste Wachstum.

Mehr über die am schnellsten wachsenden Daten- und KI-Produkte erfahren

Use of Open Source LLMS

Relative adoption of Mistral and Meta Llama open source models in Databricks foundation model APIs.

 

With each model, there is a trade-off between cost, latency and performance. The usage of the two smallest Meta Llama 2 models (7B and 13B) is significantly higher than that of the largest, Meta Llama 2 70B. Across both Llama and Mistral users, 77% choose models that are 13B parameters or smaller. This suggests that companies are weighing the costs and benefits of model size when selecting the right model for a specific use case.

State of Data and AI

To see more insights, download the full State of Data + AI report.

Download the report