メインコンテンツへジャンプ
Data AI

エグゼクティブのためのデータ、アナリティクス、AI変革ガイド 第1回: モダナイゼーションのためのBlueprint

クリス・ダゴスティーノ
Mimi Park
Usman Zubair
Share this post

Original Blog : The Executive’s Guide to Data, Analytics and AI Transformation, Part 1: A blueprint for modernization

翻訳: junichi.maruyama 

 

今、組織はこれまで以上に、市場機会や新たなリスクに迅速に適応し、現代のダイナミックな経済において適応し、革新し、繁栄するためのより良い地位を築く必要があります。ビジネスリーダーは、デジタルトランスフォーメーションは、コストを削減し、ビジネス価値を高めながら、ビジネスを実行するための新しいテクノロジー基盤を構築する機会であると捉えています。

しかし、相反する組織の優先順位、レガシーベースの情報システム、バラバラのデータ環境は、その実現を困難にしています。そのため、データ、アナリティクス、AIのエグゼクティブは、最新のデータアーキテクチャを容易に導入・移行できるような包括的な戦略を策定し、実行する必要があります。このブログシリーズでは、ご自身の旅に出る際に考慮すべき重要な洞察と戦術をご紹介します。

はじめに、すべてのデータおよびプラットフォームのモダナイゼーションイニシアチブの基礎となるべき6つの戦術を提案します。

  1. 経営者の賛同と支持を得る
    大組織を変えるのは難しいことですが、不可能ではありません。成功させるためには、CEOや取締役会などの最高レベルの経営陣からの揺るぎない賛同とサポートが必要です。このサポートがあれば、戦略を練り、アーキテクチャを決定し、ビジネスのあり方を真に変えることができるソリューションを導入するために必要な力を得ることができます。しかし、それがなければ、成功する見込みのない、非常に高価な科学プロジェクトになってしまいます。このイニシアチブをサポートするために追加される作業は、ビジネスだけでなく、その中の人材にとっても有益であることを明確に説明することで相殺されなければなりません。変革は、人々の日常的な仕事の進め方にポジティブな変化をもたらすはずです。
  2. マルチクラウドに "オールイン "する
    COVID-19の大流行により、デジタルビジネスの加速を目的としたクラウドベースのソリューションが急速に普及し、組織はこの機会にオンプレミスとクラウドベースのサービスの使い分けを見直すことになりました。クラウドベンダーは、インフラストラクチャー・アズ・ア・サービス(IaaS)、プラットフォーム・アズ・ア・サービス(PaaS)、および -SaaSソリューションなど、多くのメリットを組織に提供しています。これらの利点は、特にオープンソースソフトウェアの使用と組み合わせることで、組織が最新技術を利用するスピードを上げると同時に、予算が限られているこの時代に設備投資を削減することができます。

    同時に、企業はベンダーロックインをよく認識しており、アプリケーションを抽象化して、ビジネス上やむを得ない理由があればクラウド間で移動できるようにしたいと考えています。マルチクラウドは、データに対する組織の主権を高め、どこでもワークロードを実行できる柔軟性を提供し、異なるクラウドプロバイダー上で動作するビジネスを買収する際の統合を容易にし、消費者の個人情報に対するリスクを低減するためにデータのフットプリントを多様化することを企業に要求するかもしれない新たな規制へのコンプライアンスを簡素化します。その結果、データの可搬性と異なるクラウドプロバイダー上でワークロードを実行する能力がますます重要になってきています。
  3. ビジネスアプリケーションのモダナイゼーション
    組織がクラウドの導入を加速し始めたとき、単純な「リフト&シフト」アプローチは避けるべきです。オンプレミス・アプリケーションの大半は、クラウドを念頭に置いて構築されたものではありません。セキュリティ、回復力、スケーラビリティ、フェイルオーバーの処理方法が異なるのが一般的です。また、アプリケーションの設計は、GDPRCCPA といった規制要件の遵守を困難にするような方法でデータを保存することが多い。最後に、アプリケーションの機能や性能はモノリシックな性質を持っており、そのため密に結合されている場合があります。これに対し、最新のクラウドアプリケーションはモジュラー設計で、RESTfulなウェブサービスやAPIを使用して、アプリケーションの機能へのアクセスを容易に提供します。

    最初のステップとして、組織はビジネスクリティカルなアプリケーションの目録を作成し、ビジネスへの影響に基づいて優先順位を付け、クラウドベースの展開のために一貫した方法で近代化する必要があります。これらのアプリケーションは、組織内で消費されるデータの大部分を生成し保存するものです。クラウドベースのアプリケーション設計に一貫したアプローチを用いることで、必要なときに簡単にデータを抽出することができます。
  4. すべてのデータをデータレイクに着地させる
    データ、アナリティクス、AIを推進する組織は、サイズ、形状、速度に関係なく、すべてのデータをできるだけ早く保存し処理できる必要があります。データは、さまざまなビジネスアプリケーションにサイロ化されていることが多く、アクセスするのが難しい、あるいは遅い。また、データウェアハウスのようなデータストアにデータがロードされるのを待つ余裕もなく、そのデータに関する非常に特殊な質問にのみ対応する定義済みのスキーマが必要です。さらに問題を複雑にしているのは、あらかじめ定義されたデータストアに適合するように簡単に操作できない新しいデータセットをどのように扱うかです。新しい洞察をできるだけ早く見つけるにはどうしたらいいのでしょうか?
  5. "継ぎ目 "にいる時間を最小限にする
    データ変換を始めるにあたり、時間がかかればかかるほど、組織にリスクとコストをもたらすことを知ることが重要です。既存のデータエコシステムを最新のデータスタックに移行するための段階的なアプローチでは、ある程度の期間、新旧の2つの環境で同時に運用する必要があります。これは、あなたのビジネスに一連の瞬間的な悪影響を及ぼすことになります:
    • 2つのインフラを運用することになるため、運用コストが大幅に増加します。
    • 2つの異なるエコシステムにデータの複数のコピーを置くことになるため、データガバナンスのリスクが高まります。
    • プラットフォームが全く異なるセキュリティモデルやサイバー防御を持つ可能性が高いため、サイバー攻撃のフットプリントとベクトルが増加する。
    • 複数環境の運用が困難なため、IT要員に負担をかける。
    • ビジネスパートナーが、どの環境をどのようなデータワークロードに使用するかを確実に把握するために、正確なコミュニケーションが必要です。
    IT労働力への負担を軽減するために、新システムの導入と展開の間、レガシーシステムの「明かりを灯し続ける」ために、人材派遣会社を雇う組織もあります。しかし、これは事業継続のための重要な経験ではあるが、短期間であることを忘れてはならない。
  6. レガシープラットフォームの停止
    シームでの時間を最小限にするという目標に沿って、プロジェクト計画とタイムラインには、レガシープラットフォームをシャットダウンするための手順と順序を含める必要があります。例えば、多くの企業がオンプレミスのHadoopデータレイクをクラウドベースのオブジェクトストアに移行しています。

    オンプレミスのHadoopシステムを例にとると、レガシーシステムをシャットダウンするためのアプローチは、一般的に次のようになります:
    1. Hadoop環境で実行されるジョブを所有するステークホルダー(ビジネスおよびIT)を特定する。
    2. Hadoop環境で実行されるジョブを所有するステークホルダー(ビジネスおよびIT)を特定し、緊急修正または絶対に重要な新しいビジネスユースケースを除いて、Hadoop環境
        変更を加えることができないことを宣言します。
    3. Hadoop環境にデータを供給するソース・システムとそれぞれのデータ・フロー・パスのインベントリを作成する。
    4. Hadoop 環境に現在保存されているデータをインベントリ化し、その変化率を把握します。
    5. データを処理するソフトウェアプロセス(別名:ジョブ)を洗い出し、ジョブの消費者と出力を理解する。
    6. 最新のデータアーキテクチャに移行するジョブに優先順位をつける。データの入力、ジョブの実行、ジョブの出力、下流の消費者を1つずつ新しいアーキテクチャに移植する。
    7. 一定時間、レガシーと新しいジョブを並行して実行し、スムーズに動作していることを確認する。
    8. レガシーのデータフィード、ジョブ実行、コンシューマーを停止する。待つ。煙が出ないか確認する。
    9. すべてのジョブの移行が完了するまで、繰り返し実行する。
    10. Hadoopクラスターをシャットダウンします(複数可)。

マルチクラウド戦略を促進するために、EMRやDataprocのようなクラウドネイティブのビッグデータシステムから移行する際にも、同じプロセスを踏むことができます。ただし、レガシー環境に変更を加えたり、寿命を延ばしたりするような圧力がかかったときに、組織として踏ん張れるかどうかを確認することが重要です。レガシーシステムをいつ引退させるか明確な日付を設定することで、チームが新しい最新のデータアーキテクチャに乗り込む際に強制力を持たせることができる。レガシープラットフォームの停止を実現するためには、経営陣の賛同を得ることが重要な役割を果たします。

まとめ

このテンプレートは、これから始める場合でも、すでに複数年の戦略の過程にある場合でも、いつでも適用でき、組織の膨大なポートフォリオに1つずつプロジェクトとして取り組む際に繰り返し使用することが可能です。マルチクラウドに「オールイン」し、すべてのデータをデータレイクに統合し、経営陣のスポンサーシップを確保することで、予測不可能でダイナミックなビジネス環境におけるピボットを通じて、データ近代化戦略の強固な基盤を提供することができます。

実際、ビッグデータ(およびスモールデータ)の最新イノベーションであるレイクハウスを採用し、データウェアハウス、データレイクのアーキテクチャ、ユースケースをDatabricks上で統一することで、すでに何千ものお客様がデータとAIの能力を革新しています。別個の冗長なデータ環境の管理、それぞれのセキュリティとガバナンスの管理、そしてそれぞれのための支払いは、私たちのお客様にとって昨日の話となります。もっと詳しくお知りになりたい方は、ぜひお問い合わせください。

もっと詳しく知りたいですか?当社のeBook「Transform and Scale Your Organization With Data and AI.」をチェックしてください。

Databricks 無料トライアル

関連記事

Data AI

Five Challenges CIOs Need to Overcome in the New Year

February 1, 2023 Josh Howard による投稿 in データ戦略
As IT leaders kick off the new year during one of the most tumultuous times in recent history, CIOs are being forced to...
Data AI

6 Guiding Principles to Build an Effective Data Lakehouse

In this blog post, we will discuss some guiding principles to help you build a highly-effective and efficient data lakehouse that delivers on...
Data AI

Hadoop からレイクハウスへの移行:成功のための 5 つのステップ

August 6, 2021 Harsh Narula による投稿 in データ戦略
Hadoop (ハドゥープ)から レイクハウスアーキテクチャ のようなモダンなクラウドベースのアーキテクチャへの移行は、技術的な判断ではなく、ビジネス的な判断です。以前のブログ、 It’s Time to Re-evaluate Your Relationship With Hadoop では、組織がHadoop との関係を再評価する必要がある理由を解説しました。技術やデータ、ビジネスのステークホルダーが、エンタープライズの Hadoop を移行する決断をした後、移行を実行する前に 考慮すべき課題 があります。本ブログでは、実際の移行プロセスそのものに焦点を当て、移行を成功させるための重要なステップや、新たなデータドリブンなイノベーションの成功にレイクレイクハウスアーキテクチャが果たす役割を説明します。 移行のステップ 率直に言って、移行は決して容易ではありません。しかし、移行を構造化することで、リスクを最小限に抑え、ビジネスの継続性を確保し、コストを効果的に管理できます。そのためには、 Hadoop からの移行
データ戦略一覧へ