メインコンテンツへジャンプ
Company Blog

日本のDatabricks Championの皆様に、目指したその理由や、これからの思いについて伺う「集まれ!Legendary Heroes of DATA + AI !!」。お楽しみいただいておりますでしょうか?
Vol1、Vol 2 でご紹介した皆様からのコメントからは熱い想いが溢れていますよね。私たちにとっては本当に心強い存在であるとともに、正に、Legendary Heros of DATA + AI !! に相応しい皆様だと思います!!

さて、最終回のVol.3 では、日本マイクロソフト 中里 之 様をご紹介します。

—- 以前にご紹介したLegendary Heroes of DATA+AI!はこちら--------
[Vol.1] 株式会社NTT データ       斎藤 祐希 様、洪 元 様
[Vol.2]  アクセンチュア株式会社   飯塚 希翔 様              

Portrates of Legendary Heroes of Data+AI

<日本マイクロソフト株式会社 中里 之 様>

Microsoft Azure のクラウド ソリューション アーキテクトの中里です。まずは簡単に Apache Hadoop と Apache Spark、そしてデータブリックスに関する私の経歴についてお話しします。

Microsoft Nakazato

はじめて私が Hadoop に触れたのは SIer の JSOL に所属していた 2011 年でした。クラウドが流行する前でしたから、注文から数週間後に船便で配送されたサーバーをラックに設置し OS から何からインストールしてセットアップしていたことを思い出します。

それから 4 年ほど Hadoop 関連の様々なプロジェクトに携わった後 (NTT データの皆様とご一緒する機会が多く、大変お世話になりました)、2015 年にソフトバンクに入社し、グループ会社である Agoop の流動人口に関する事業に携わりました。Spark をコア技術とした大規模データの収集・蓄積・分析用のプラットフォームの構築と運用のリードを通じて、複数台のサーバーを並べてスケール アウトする Spark と、必要なときすぐに仮想マシンを作成できるクラウドの相性の良さを実感しました。

現職の日本マイクロソフトには 2019 年に入社しました。マイクロソフトが Spark に注力しているイメージはあまり無かったのですが、いざ働いてみるとマイクロソフトの様々なサービスの表側と裏側で Spark の技術が活用されていることに驚きました。中でも特に好きなサービスが二つあり、一つ目が Azure Data Factory と Azure Synapse Analytics に搭載されている「マッピング データ フロー」です。ユーザーが Web ブラウザ上でのドラッグ & ドロップ ベースの操作で ETL の処理フローを組み立てて、その処理が自動的にプログラムに変換されて Spark クラスターで実行されるというものです。Spark を使ったプログラミングはとっつきにくいイメージを持たれがちなのですが、マッピング データ フローは Spark の知識が無くても扱えますから、プログラミングの経験が少ない、いわゆる市民開発者の方も Spark のパワーを使ってスケーラブルにデータを処理できる素晴らしい機能だと思います。

そして、二つ目が Azure Databricks です。データブリックスはマルチ クラウドで動くサービスですが、Azure ではファースト パーティのサービスとして提供しているためサポートや請求が Azure に一元化されますし Azure ポータルからすぐに使い始められるのも特長です。データブリックスは Spark の創始者たちが立ち上げた会社でもあり、彼らが今でも精力的に開発を行っていることもあって優れた機能が次々とリリースされるのも大きな魅力です。特に 2021 年に一般提供が開始された Databricks SQL は白眉の出来で、オブジェクト ストレージ上のデータを ANSI SQL でハイ パフォーマンスに分析でき、OSS のダッシュボード ツール「Redash」ベースの操作感でリッチなダッシュボードが作れて、さらに Microsoft Power BI などの BI ツールともシームレスに連携できます。データ分析プラットフォームの技術選定を行う際には Databricks SQL をぜひ最初の選択肢の一つに加えて欲しいと思います

こうして日本マイクロソフトに入って Azure Databricks が推しのサービスの一つになったのですが、2020年に Databricks Champion プログラムの募集が社内で始まり、丁度良いタイミングでしたので参加を決めました。それから 2 年以上にわたって様々な活動 (データブリックスの竹下さん・小谷さんらとの 2 週間ごとのミーティング、データブリックスの認定資格取得やトレーニング受講、お客様やパートナー様への技術支援、イベント登壇、他社の Databricks Champion との交流など) に取り組み、この度 Databricks Champion に認定頂きました。

最後に今後の抱負について記載します。私の職業人としてのミッションは、多くの方がクラウドのパワーを使って簡単でスケーラブル、かつコスト効率よくデータを活用できるように支援することです。これまでの経験から、データ活用のためのプラットフォームを構築する上でいま最も優れたアプローチの一つがレイクハウスだと確信していますし、データブリックスと Azure のサービスを組み合わせることでデータ エンジニアのような専門家の方はもちろん、市民開発者の方もレイクハウスを素早く実現できる時代が来ています。データブリックスや Databricks Champion の皆様とともに日本のデータ活用を盛り上げていけるよう頑張っていきたいと思います。
ーーーーーーーーー

私の職業人としてのミッションは、多くの方がクラウドのパワーを使って簡単でスケーラブル、かつコスト効率よくデータを活用できるように支援すること
激アツです!!
私たちデータブリックスのミッションも、データとAIの活用を通し、多くの企業がイノベーションを起こせる支援をすることなので、このミッションコンプリートを目指し、引き続きご支援よろしくお願いいたします!!


3回にわたってご紹介した「集まれ!Legendary Heroes of DATA + AI !! 」、弊社では今後もこのLegendary Heroes of Data+ AI を目指す皆様を強力にサポートします!!

ーーーーーーーーーーーー
Databricks Champion とは
Databricks Champion は、弊社が提供する「データとAIの民主化」を推進するソリューションの特性や概念をご理解いただき、技術的な専門家という側面だけでなく、エバンジェリストとして、その深い知見をマーケットに広く発表いただく”Legendary Heroes of DATA + AI”です!
当プログラムは、こうしたThought Leadershipの役割をも担い、インフルエンサーとしてマーケットに一石を投じていただける方をDatabricks Championとして認定するプログラムです。

<Databricks Champion になるための9つのステップ>

  1. Determine track - Data Engineering / Data Science
  2. Set bi-weekly sync cadence with your Databricks mentor
  3. Plan & attend Databricks academy course
  4. Plan & attend Databricks architecture workshop
  5. Setup Databricks workspace
  6. Download & practice Databricks demos 
  7. Develop technical validation plan & execute a mock POC
  8. Shadow/co-develiver a joint customer engagement

Become Databricks certified : Pass Certified Associate Developer exam

Databricks 無料トライアル
Databricks ブログ一覧へ