プラットフォームブログ

ページ 7

Databricksをユーザが容易に利用できるようにするために、新しいIDとアクセス管理の機能強化を発表

December 20, 2023 シッダールト・バイ、レイ・ニー、ケリー・アルバーノ、アンナ・シュレスティニアンによる投稿 in プラットフォームブログ

Databricks のセットアップとスケールを簡素化する新しいアイデンティティとアクセス管理機能をご紹介します。Unity Catalogは Databricks Data Intelligence Platform におけるガバナンスの中心にあります。Unity Catalogの一部であるIDおよびアクセス管理機能は、以下の原則に基づいて設計されています：オンボーディング、管理、コラボレーションのための、セキュアでスケーラブル、かつ汎用的なアイデンティティおよびアクセス管理を構築します。直感的で拡張可能な監査対応パーミッションを使用して、顧客がDatabricksへのアクセスを容易に制御できるようにします。ブラウザおよび API アクセスのための、ワールドクラスで拡張性の高い認証を開発し、顧客およびパートナーが Databricks Data Intelligence Platform のパワーをシンプルかつ安全に活用できるようにします。このブログでは、既存のアイデンティティおよびアクセス管理機能につ

SAP Datasphere と Databricks Data Intelligence Platform でマーケティングキャンペーンの効果を分析する

December 19, 2023 クリシュナ・サティヤバラプ、カーラ・フィリップス、サンゲータ・クリシュナモワルティによる投稿 in プラットフォームブログ

効果的なキャンペーンは、商品の売上を増やし、在庫を処分し、顧客を増やし、新商品を紹介することで、企業の収益を向上させることができます。キャンペーンには、オフラインまたはオンラインチャネルを通じた販売促進、クーポン、リベート、季節割引などが含まれます。そのため、キャンペーンを綿密に計画し、その効果を確実にすることが重要です。キャンペーンが販売成績に与える影響を分析することも同様に重要です。効率的な分析により、企業は過去のキャンペーンから学び、今後の販売促進を改善することができます。チャレンジとモチベーション：過去のデータを分析し、マーケティングキャンペーンのために正確な機械学習予測を行うことは、非常に困難なことです。それぞれのキャンペーンには独自の指標があり、それぞれのケースに合った分析アプローチを適応させる必要があります。さらに、キャンペーンではさまざまなデータソースやプラットフォームを利用するため、データ形式や構造も多種多様になります。これらの多様なソースからのデータを統合データセットに統合することは困難

R開発者にレイクハウスを：Databricks Connectがsparklyrで利用可能に

December 13, 2023 ラフィー・カーランシック、ウラディスラフ・マンティック＝ルーゴ、ステファニア・レオーネによる投稿 in パートナー

CRAN 上の sparklyr の最新リリースに Databricks Connect のサポートが導入されたことをお知らせできることを嬉しく思います。R ユーザーは、リモートの RStudio Desktop、Posit Workbench、またはアクティブな R ターミナルやプロセスから、Databricks のクラスタリングと Unity Catalog にシームレスにアクセスできるようになりました。今回のアップデートにより、R ユーザーであれば誰でも、わずか数行のコードで Databricks を使ってデータアプリケーションを構築できるようになりました。 Sparklyr と Python...

レイクハウス・モニタリング: データとAIの品質監視のための統合ソリューション

December 12, 2023 ジャクリーン・リー、アルキス・ポリゾティス、Kasey Uhlenhuth による投稿 in プラットフォームブログ

はじめに Databricks Lakehouse Monitoring (レイクハウス・モニタリング)を使用すると、データからフィーチャー、MLモデルまで、すべてのデータパイプラインを追加のツールや複雑な操作なしに監視できます。 Unity Catalog に組み込まれているため、ガバナンスと並行して品質を追跡し、データとAI資産のパフォーマンスについて深い洞察を得ることができます。Lakehouse Monitoringは完全にサーバーレスなので、インフラストラクチャやコンピュート構成のチューニングを心配する必要はありません。 Lakehouseのモニタリングに対する統一されたアプローチにより、 Databricks Data Intelligence Platform で直接、品質の追跡、エラーの診断、ソリューションの検索が簡単に行えます。Lakehouse Monitoringを最大限に活用する方法を本記事ではご紹介します。なぜレイクハウス・モニタリングなのか？データパイプラインは順調に動いているよう

dbtとDatabricksを用いてコスパの良いリアルタイムデータ処理を行う

December 12, 2023 シャビル・カーンバイ、ポール・ラパス、ビラル・アスラムによる投稿 in プラットフォームブログ

ビジネスが成長するにつれ、データ量はGBからTB（またはそれ以上）に拡大し、レイテンシー要求は数時間から数分（またはそれ以下）になり、ビジネスに新鮮な洞察を提供するためのコストはますます高くなります。これまでPythonやScalaのデータエンジニアは、このような需要に応えるためにストリーミングを利用し、新しいデータをリアルタイムで効率的に処理してきましたが、SQLベースのdbtパイプラインを拡張する必要があるアナリティクスエンジニアには、このような選択肢はありませんでした。しかし今は違います！このブログでは、Databricks の新しいストリーミングテーブルとマテリアライズドビューを使用して、SQL と dbt のシンプルさで新鮮なリアルタイムのインサイトをビジネスに提供する方法を説明します。背景 2023 Data + AI Summitでは、 Databricks SQLにストリーミングテーブルとマテリアライズドビューを導入しました。この素晴らしい機能により、Databricks SQL ユーザーは

Databricks Unity CatalogとTredence UnityGO!でデータ共有からビジネス価値をさらに向上させましょう！

December 8, 2023 マウリク・ディクシット、デビッド・ルグランによる投稿 in プラットフォームブログ

企業のリーダーは、ビジネスチームが洞察力を高め、より良い意思決定を行い、イノベーションを加速するために活用できる高品質なデータの集中ソースを作成するために、 Databricks Data Intelligence Platform を活用しています。最近の調査では、最高データ責任者（CDO）は、明確で効果的なデータガバナンスの確立（51%）、データ品質の向上（48%）、高度なアナリティクス機能の構築と維持（42%）、ビジネスインテリジェンス機能の構築と維持（36%）、データ収益化機能の開発（21%）、データ、アナリティクス、人工知能（AI）倫理の向上（21%）を望んでいると回答しています。データ変革が最重要課題であることは明らかです。歴史的に、データ、IT、セキュリティの各チームは、データの統一と民主化に関連する以下の課題に取り組んできました：データの保護と管理：企業チームは、大規模な言語モデルやドメイン固有のモデルの導入を急いでおり、これらのモデルは広範なクリーンデータを必要とするため、データガバナ

Databricks Vector Search パブリックプレビューのご紹介

December 7, 2023 アキル・グプタ、セルゲイ・ツァレフ、エリック・ピーターによる投稿 in エンジニアリングのブログ

昨日発表した RAG(Retrieval Augmented Generation )に続き、本日、Databricks Vector Searchのパブリックプレビューを発表します。6月に開催されたData + AI Summitでは、限られたお客様を対象としたプライベートプレビューを発表しましたが、今回はすべてのお客様にご利用いただけるようになりました。Databricks Vector Searchは、PDF、Officeドキュメント、Wikiなどの非構造化ドキュメントに対する類似検索を通じて、開発者がRAG（Retrieval Augmented Generation）や生成AIアプリケーションの精度を向上させることを可能にします。Vector Search は Databricks Data Intelligence Platform の一部であり、RAG およびジェネレーティブ...

Databricksで高品質のRAGアプリケーションを作成する

December 6, 2023 Patrick Wendell（パトリック・ウェンデル）、ハンリン・タンによる投稿 in お知らせ

RAG（Retrieval-Augmented-Generation ）は、独自のリアルタイムデータを LLM（Large Language Model）アプリケーションに組み込む強力な方法として、急速に台頭してきた。本日Databricksユーザーが企業データを使用して高品質な本番LLMアプリケーションを構築するためのRAGツール群を発表できることを嬉しく思う。 LLMは、新しいアプリケーションを迅速にプロトタイプ化する能力において、大きなブレークスルーをもたらした。しかし、RAGアプリケーションを構築している何千もの企業と仕事をした結果、彼らの最大の課題は、これらのアプリケーションを本番で用いることができる品質にすることであることがわかった。顧客向けアプリケーションに要求される品質基準を満たすためには、AIの出力は正確で、最新で、そして企業のコンテキストを認識し、安全でなければならない。高品質なRAGアプリケーションを構築するためには、開発者はデータとモデル出力の品質を理解するための豊富なツール

Partner Connectに新たに5つのインテグレーションを追加しました

November 30, 2023 ライリー・マリス、ザヒーラ・ヴァラーニ、マラキ・ケテマ、松本大河、ブレヒト・ムーラン、リジェン・シアンによる投稿 in プラットフォームブログ

Databricks Data Intelligence Platform のデータでパートナーソリューションを使用し、ビジネス要件に最適なものをシームレスに採用できるようにするワンストップポータルであるDatabricks Partner Connect に、新たに5つのインテグレーションを追加し、みなさまに紹介できることを嬉しく思っています。この四半期で、Data Ingestionカテゴリに3社、Data GovernanceとMachine Learningの両方に1社のパートナーを追加しました。また、Partner Connectの機能を拡張し、パートナー製品の本番環境との直接統合をサポートするようになりました。これは何を意味しているのでしょうか？ Monte Carlo との統合は、これらの機能を活用しており、Databricksから Monte Carlo のアカウントに直接接続し、本番データパイプラインの品質監視を開始することができます。これは、エコシステム内のデータとAIツールへの接続をこれ

DatabricksがAWS ISV Partner of the Yearを受賞しました

November 28, 2023 ウィル・コリンズによる投稿 in プラットフォームブログ

Databricksが北米のAWS ISV Partner of the Yearを受賞したことをお伝えできることを嬉しく思います。この賞は、AWSを利用してコストを削減し、俊敏性を高め、イノベーションを加速させているトップISVパートナーを表彰するものです。今回の受賞は、AWSとシームレスに統合されたシンプルで統合されたデータ・インテリジェンス・プラットフォームを提供する我々のパートナーシップと能力の強さを裏付けるものです。 Databricks はまた、以下の賞の最終選考にも残り、業界や地域を問わずデータとアナリティクスの専門性を実証したことが評価されました： ISVデータ＆アナリティクス・パートナー・オブ・ザ・イヤー - グローバルインダストリー・パートナー・オブ・ザ・イヤー - リテール& コンシューマー・パッケージド・グッズ - グローバルインダストリーパートナー・オブ・ザ・イヤー - 広告・マーケティング部門 -...