Hotels.com は、同社のウェブサイ トで325,000以上のホテルの何百万もの写真をホストしています。毎日、何千もの新しい写真がホテルおよび顧客によってアップロードされています。これらの写真は、重複や低品質の画像を避けるために迅速に分析し、論理的に並べ替えられるよう分類する必要があります(例:キッチン、プール、ジムなど)。最後に、顧客がサイトを検索するとき、顧客が自分のニーズに最適なホテルを見つけられるように、おすすめのホテルをパーソナライズする必要があります。これを実現するためには、膨大な計算能力と高度な分析が必要です。
機械学習を活用した顧客体験の促進:各宿泊先に対応する画像ファイルが大量に重複しており、ランク付けと分類が乱雑な状態になっていました。機械学習/深層学習モデルの本番環境へのデプロイでは、リアルタイムのスコアリングを構築し、効率化する必要がありました。
データパイプラインの強化と高速化:SQL と SAS を使用しているオンプレミスの Hadoop cluster では、大規模な data science を実行するのに時間がかかり、制限がありました(データのわずか 10% をデータパイプラインで処理するのに 2 時間必要)。
顧客のコンバージョン数の増加: リアルタイムで顧客のトレンドを把握し、コンバージョン率とライフタイムバリューを高めるための戦略を立てられるようになることが目標でした。
Databricks は、顧客の行動を予測し最適化されたユーザー体験を提供できるよう、「data science に重点を置く」という Hotels.com の目標を支援しました。
cluster 管理: インフラストラクチャをさらに複雑にすることなく、データ量を大幅に拡張できます。
インタラクティブなワークスペース:Hotels.com 内の data science チームおよび、Expedia 内のその他の事業部門間のコラボレーションの文化を促進します。
Databricks のランタイム:大規模なストリーミングデータであっても処理性能を向上させます。
マット・フライヤー
Hotels.com の VP 兼最高 Data Science 責任者