Original : The 2023 State of Data + AI: How Businesses Are Preparing for the New Age of AI
翻訳: junichi.maruyama
昨年末にChatGPTが公開されて以来、大規模言語モデル(LLM)への関心が歴史的に高まり、この話題は避けて通れないものとなっています。LLMの技術は比類ない速さで向上しているだけでなく、企業もかつてないほど独自のモデルを構築しています。今や、予測モデルはミッションクリティカルな業務を支え、過去にさかのぼってのレビューではなく、未来を見通す窓を組織に与え、より迅速で無駄のない業務を支援します。
この新しいコンピューティング革命の端緒となった今、私たちは、企業がこの変革においてどのような状況にあるのか、また、どのようなプラットフォームやツールを活用しているのかを正確に知りたいと考えました。9,000社以上のグローバルなDatabricksのお客様からの匿名化された利用データを分析することで、私たちは、企業のデータとAIへの取り組みを包括的に見る「the 2023 State of Data + AI」をまとめました。
ここでは、私たちが発見したことを垣間見ることができます:
- LLMをめぐる誇大広告は本物だ: 2022年11月末から2023年5月初めにかけて、OpenAIなどのモデルにアクセスするためのSaaS LLMの利用率は、Lakehouseの顧客で1310%と飛躍的に伸びています。国産LLMのトレーニングに使用され、ChatGPTの発売前から需要があったHuggingFace(NLPツールキットおよびモデルハブ)のようなTransformer関連ライブラリは、同じ期間内に82%成長しました。
- データ変換と統合は、これまで以上に不可欠です: Databricksで最も成長しているツールは、dbt(前年比206%)とFiveTran(181%)です。しかし、最も人気のあるデータおよびAI製品10種類のうち、6種類がInformaticaやQlikなどのデータ統合ツールであり、Databricks Lakehouseで最も急速に成長している市場となっている.
- 企業がオープンソースに注目: 最も人気のあるデータおよびAI製品を見ると、Microsoft Power BIとPlotlyが上位に君臨しています。しかし、組織はオープンテクノロジーに強い関心を示しており、最も人気のあるデータおよびAI製品10種類のうち8種類が、dbt、Hugging Face、GeoPandasなど、オープンソースソフトウェアをベース にしています。.
- 企業はかつてないほど多くのAIプロジェクトを実施し、より良い成果を上げています: 本番(運用)候補のモデル数は前年比411%増、実験的プロジェクト数は54%増となりました。また、当社のデータによると、平均して実験的なモデルの3つに1つが実世界の候補になっています(昨年は5つに1つ)。これは、組織がこうしたプロジェクトの構築と拡張をよりよく行うようになっていることを示唆しています。
- AIは伸びているが、従来のデータ分析を忘れてはいけない: 昨年は、Lakehouseの上で動作するプログラムとしてPower BIが最も人気でした。Lakehouseは、Databricks SQLによるサーバーレスデータウェアハウスなど、データウェアハウスへの利用が増加しており、前年比144%の成長を遂げました。
まだ始まったばかりですが、これらの新しいトレンドは、AIの未来を決定付けるに違いありません。そして、ビジネスリーダーは注意を払う必要があります。DS/MLのパワーを活用する企業が、次世代のデータをリードしていくことは、かつてないほど明確なことです。
詳しくは、こちらのレポートをダウンロードしてご覧ください!