製品 | Databricks Blog

ページ 4

Databricks Unity CatalogをオープンなApache Hive Metastore APIで拡張可能になりました

June 11, 2023 トッド・グリーンスタイン、Junlin Zeng、Vihang Karajgaonkar、ジーシャン・パパ、Abhishek Pratap Singh、サチン・タクール、Matei Zaharia による投稿 in プラットフォームブログ

Original: Extending Databricks Unity Catalog with an Open Apache Hive Metastore API 翻訳: saki.kitaoka 本日、Databricks Unity CatalogのHive Metastore（HMS）インターフェイスのプレビューを発表しました。Apache Hiveは、業界で最も広くサポートされているカタログインターフェースであり、事実上すべての主要なコンピューティングプラットフォームで使用可能です。この機能により、企業はデータ管理、発見、ガバナンスをUnity Catalogに一元化し、Amazon Elastic MapReduce（EMR）、オープンソースのApache Spark、Amazon...

CrowdStrike Falconのイベントに向けてサイバーセキュリティのレイクハウスの構築

June 8, 2023 Aemro Amare、アルン・パムラパティ、Yong Sheng Huang、Jason Pohl による投稿 in プラットフォームブログ

翻訳: Masahiko Kitamura オリジナル記事: Building a Cybersecurity Lakehouse for CrowdStrike Falcon Events 今すぐDatabricksを導入して、こちらのノートブックを実行してみてください。エンドポイントデータは、セキュリティチームが脅威の検出、脅威の狩猟、インシデント調査、およびコンプライアンス要件を満たすために必要です。データ量は、1日あたりテラバイト、1年あたりペタバイトになることもあります。ほとんどの組織がエンドポイントログの収集、保存、分析に苦労しているのは、このような大容量のデータに関連するコストと複雑さのためです。しかし、こうである必要はありません。この2部構成のブログシリーズでは、Databricksを使用してペタバイトのエンドポイントデータを運用し、高度な分析によってセキュリティ体制を向上させる方法を、コスト効率の良い方法でご紹介します。第1部（このブログ）では、データ収集のアーキテクチャとSIEM（Sp

ファイルアップロードとデータ追加UIでLakehouseに簡単に取り込む

May 31, 2023 Emma Liu、Vincent Liaw、Yu Guo、マラキ・ケテマ、Amit Kara、ブレヒト・ムーランによる投稿 in プラットフォームブログ

Original: Easy Ingestion to Lakehouse with File Upload and Add Data UI 翻訳: junichi.maruyama Lakehouseへのデータ取り込みは、多くの組織にとってボトルネックとなり得ますが、Databricksを使用すれば、様々なタイプのデータを迅速かつ容易に取り込むことができます。小さなローカルファイルでも、データベース、データウェアハウス、メインフレームなどの大規模なオンプレミスストレージプラットフォームでも、リアルタイムストリーミングデータでも、その他のバルクデータ資産でも、DatabricksはAuto Loader、COPY INTO、Apache Spark™ API、設定可能なコネクタなどの幅広い取り込みオプションであなたをサポートします。また、ノーコードまたはローコードアプローチをご希望の場合は、Databricksはインジェストを簡素化する使いやすいインターフェイスを提供します。データインジェストブログシリーズの第

Unity Catalogを通じたデルタシェアリングで構造化ストリーミングを使う

May 9, 2023 Will Girten、Josh Seidel、Lin Zhou、サチン・タクールによる投稿 in プラットフォームブログ

Original : Using Structured Streaming with Delta Sharing in Unity Catalog 翻訳： junichi.maruyama この度、Azure、AWS、GCPにおいて、Structured StreamingをDelta Sharingで使用するためのサポートが一般提供（GA）されたことをお知らせします！この新機能により、Databricks Lakehouse Platform上のデータ受信者は、 Unity Catalog を通じて共有されたDelta Tableからの変更をストリーミングできるようになります。データプロバイダーは、この機能を活用することで、Data-as-a-Service...

新しいナビゲーションUIで目的のものを見つけましょう

May 4, 2023 Austin Green、Jim Allen Wallace、ジャスティン・キム、Tyler Townley、シャオレイ・シーによる投稿 in プラットフォームブログ

Original: Find what you seek with the new navigation UI 翻訳: saki.kitaoka Databricksの新しいUIがリリースされ、ナビゲーションがより簡単になります。顧客はよりシンプルなナビゲーションを求めています。 Databricksでは、顧客中心の文化があります。ユーザーからのフィードバックを真摯に受け止め、Databricksでのナビゲーション経験の改善を求めています。過去数か月間、多くの顧客と共に問題や改善されたナビゲーション経験を理解しました。ユーザーはタスクごとにクリック数を減らしたい話し合いを通じて、ナビゲーション改善に関連する2つの主題が見られました。まず、ワークスペース内でA地点からB地点への移動を容易にしたいとの要望がありました。経験豊富なユーザーや新規ユーザーにとって、目的地までのクリック数が多すぎる場合、時間がかかります。そのため、上部に統合検索を配置し、よく使われるタスクのための「はじめに」セクションを再設計しました

Databricks SQLのキャッシングを理解する： UIキャッシュ、リザルトキャッシュ、ディスクキャッシュ

May 4, 2023 ジェレミー・ルヴァレン、Chris Stevens、Bogdan Ionut Ghit、Patrick Yang による投稿 in プラットフォームブログ

Original: Understanding Caching in Databricks SQL: UI, Result, and Disk Caches 翻訳: junichi.maruyama キャッシングは、同じデータを何度も再計算またはフェッチする必要性を回避することで、データウェアハウスシステムのパフォーマンスを向上させるために不可欠な技術です。Databricks SQLでは、キャッシングによってクエリの実行を大幅に高速化し、ウェアハウスの使用量を最小限に抑えることができるため、コストの削減とリソースの効率的な利用が可能になります。この記事では、キャッシングの利点を探り、DBSQLの3種類のキャッシング：ユーザーインターフェイスキャッシュ、リザルトキャッシュ（ローカルおよびリモート）、ディスクキャッシュ（旧デルタキャッシュ）を掘り下げて説明します。キャッシングのメリットキャッシングは、データウェアハウスにおいて、以下のような多くの利点をもたらします：スピード...

Predictive I/O for Readsの一般提供開始を発表

April 26, 2023 Shoumik Palkar、Justin Breese、Shant Hovsepian、ケント・マーテン、Cyrielle Simeone による投稿 in プラットフォームブログ

Original Blog : Announcing the General Availability of Predictive I/O for Reads 翻訳： junichi.maruyama 本日、 Databricks SQL (DB SQL) 向けのPredictive I/Oの一般提供を開始します：機械学習を利用した機能で、ポイントのルックアップをより速く、より安くすることができます。Predictive I/Oは、Databricksが大規模なAI/MLシステムを構築してきた長年の経験を活用し、追加のインデックスや高価なバックグラウンドサービスなしで、Lakehouseを最もスマートなデータウェアハウスにすることができます。実際、ポイント検索では、Predictive I/Oは、インデックスと最適化サービスのすべての利点を提供しますが、それらを維持するための複雑さとコストは必要ありません。...

Predictive I/O for Updatesのパブリックプレビューのお知らせ

April 26, 2023 Piyush Revuri、バート・サンウェル、アラ・ルシャク、ラース・クロール、ポロ＝フランソワ・ポリ、Frank Munz、ヒマンシュウ・ラジャによる投稿 in プラットフォームブログ

Original Blog : Announcing the Public Preview of Predictive I/O for Updates 翻訳： junichi.maruyama 前回、 Predictive I/O と呼ばれる新技術により、CDWのお客様がノブなしで選択的読み取りを最大35倍まで改善できることをご紹介しました。本日は、もう一つの革新的な飛躍であるPredictive I/O for Updatesのパブリックプレビューを発表し、MERGE、UPDATE、DELETEのクエリパフォーマンスを最大10倍高速化することができるようになりました。 Databricksのお客様は、毎日1エクサバイト以上のデータを処理しており、50%以上のテーブルでMERGE、UPDATE、DELETEなどのデータ操作言語（DML）オペレーションを利用しています。このブログでは、Predictive I/Oが機械学習を使用してこの大規模なパフォーマンス向上を達成した方法を説明します。しかし、良い部分にスキップ

Databricks Workspaceの新しいFilesエクスペリエンスを発表

April 24, 2023 ジェイソン・メッサー、Austin Ford、ウェストン・ハッチンス、Jerry James、Jim Allen Wallace による投稿 in プラットフォームブログ

Original Blog : Launching a New Files Experience for the Databricks Workspace 翻訳： junichi.maruyama 本日、Databricksのワークスペースにおけるファイルの一般的な利用可能性を発表することを嬉しく思います。ファイルのサポートにより、DatabricksユーザーはPythonソースコード、リファレンスデータセット、その他あらゆるタイプのファイルコンテンツをノートブックと一緒に直接保存できるようになります。また、Databricksは、インラインコード実行をサポートする新しいリッチファイルエディタを一般的に利用できるようにします。この新しいエディタは、ファイルエディタにノートブックの多くの機能（入力時のオートコンプリート、オブジェクトインスペクション、コードフォールディングなど）をもたらし、より強力な編集体験を提供します。ワークスペースでのファイルサポートは、Databricks Reposでお馴染みの機能を拡張

エグゼクティブのためのデータ、アナリティクス、AI変革ガイド第2回：ユースケースの特定と優先順位付け

April 7, 2023 クリス・ダゴスティーノ、Mimi Park、Usman Zubair による投稿 in 製品

Original Blog : The Executive’s Guide to Data, Analytics and AI Transformation, Part 2: Identify and prioritize use cases 翻訳： junichi.maruyama 本連載は、データおよびAIの変革イニシアチブを率いるシニアエグゼクティブと重要な洞察と戦術を共有するための複数回シリーズのパート2です。シリーズのパート1はこちら...