メインコンテンツへジャンプ
Engineering blog

ソリューションアクセラレータ: 通信業界のための顧客離脱の予測

ダン・モリス
Hector Leano
Steve Sobel
Share this post

 

本ブログで参照する Notebook にスキップできます。

米通信大手 T-Mobile によるキャリアフリーの導入は、単なるマーケティングキャンペーンにとどまらず、米国通信市場のダイナミクスを根本的に変えるきっかけとなりました。かつての通信業界は、安定した公益事業のように成長し、携帯電話の本体料金を無料にするための通話プランによって、利用者を 2 年間の契約で縛ってきました。しかし、次の 3 つの要因により、通信業界のビジネスの本質が変わることになります。

  1. 電話番号の継続使用:2004 年以降、キャリアを変更しても電話番号は継続使用できるようになり、利用者がプロバイダを変更する際の最大の障壁の 1 つが解決しました。
  2. 通話プラン契約の廃止:携帯電話本体の価格の上昇により、各キャリアは本体購入料金の補助金を中止し、通話プランの契約が廃止されました。
  3. 競合企業:T-Mobileが、データプランの価格設定の積極的な変更と広告費への増額投資をおこない、市場シェアを拡大。これまで2強のシェアだった市場において、強力な第3の競合企業をもたらしました。

このように急速に変化するダイナミクスに伴い、通信サービスプロバイダーは従来の公益事業者から、ブロードバンド、セキュリティ、ケーブル、動画配信サービスなどの複数のビジネスラインにまたがる付加価値サービスプロバイダーへと移行しています。これに加えて、新規参入企業との競争も激化し、通信サービスプロバイダーは、あらゆるチャネルで常に、パーソナライズされたストレスフリーの顧客エクスペリエンスへの投資を加速させています。このような顧客エクスペリエンスを構築するうえで重要なのは、既存の顧客がサブスクリプションライフサイクルのどの段階にいるかを理解し、特に離脱のリスクが高い顧客を特定することです。顧客離脱防止は、どのプロバイダーにとっても最重要の戦略的分野であり続けています。多くの離脱率削減への取り組みの内容は、顧客のライフサイクルイベントを予測し、収益性の高い方法でライフサイクルを延長することを目的としています。

Databricks による通信業界向け顧客離脱予測のソリューションアクセラレータ

Databricksは、大手通信サービス事業者との連携を通じで確立したベストプラクティスに基づいて、一般的な分析や機械学習のユースケースのためのソリューションアクセラレータを開発しました。データエンジニア、データサイエンティストによる開発期間を数週間、数か月の単位で短縮できます。

このソリューションアクセラレータは、顧客の生涯価値サブスクリプションサービスからの離脱防止収益性の高い顧客維持を実現するDatabricksの取り組みを補完するものですが、通信事業向けに特化しています。

このソリューションアクセラレータでは、IBM による通信事業関連のサンプルデータセットと Lifelines ライブラリを使用して、次のことができます。

  • 生存時間分析の概要を知る:生存時間分析とは、対象となる事象が発生するまでの時間を調査・予測するために用いられる統計的手法です。
  • 生存時間分析手法のレビュー:生存時間分析の代表的な手法 3 種(カプランマイヤー法、コックス比例ハザードモデル、加速故障時間モデル)をレビューできます。
  • 顧客離脱率予測モデルの構築:モデルの出力を生涯価値計算の入力として使用できます。
  • 対話型ダッシュボードの構築:特定の加入者の3年の時間範囲における現在価値を計算します。

このソリューションアクセラレータの内容は、Databricks の Notebook に含まれています。この記事の最後のセクションからアクセスできます。

生存時間分析

生存時間分析とは、あるイベントが起こるまでの時間を解析・予測するために用いられる統計手法です。もともと、死亡までの時間に焦点を当てた医療分野で生まれました。それ以来、生存時間分析は、あらゆる業界のユースケースに適用されています。

通信業界におけるユースケースには次のようなものがあります。

  • 顧客維持:顧客維持にかかるコストは、顧客獲得のために使用するコストよりも低いということは広く知られています。通信会社は、顧客がサービス解約を検討するタイミングに関して、生存時間分析を活用し、特定の顧客がどの時点で離脱のリスクにさらされるかをより正確に予測することで、顧客維持の取り組みをより効果的に管理することができます。
  • ハードウェア障害発生の予測:顧客は、製品やサービスの契約を更新するか離脱するかの判断に利用体験の質を重視します。この体験の中核となるのは、ネットワーク自体です。障害発生までの時間を対象とした生存時間分析により、ハードウェアの修理や交換が必要となる時期を予測することができます。
  • デバイスやデータプランのアップグレード:顧客のライフサイクルの中には、プランの変更が行われる重要な瞬間があります。顧客がプラン変更を検討するタイミングに関して、生存時間分析を活用してその変化がいつ起こるかを予測し、選択された製品やサービスにポジティブな影響を与えるためのアクションを取ることができます。

In contrast to other methods that may seem similar on the surface, such as linear regression, survival analysis takes censoring into account. Censoring occurs when the start and/or end of a measured value is unknown. For example, suppose our historical data includes records for the two customers below. In the case of customer A, we know the precise duration of the subscription because the customer churned in December 2020. For customer B, we know that the contract started four months ago and is still active, but we do not know how much longer they will be a customer. This is an example of right censoring because we do not yet know the end date for the measured value. Right censoring is what we most commonly see with this form of analysis.

お客様契約開始日契約終了日契約期間契約中
フラグ
A2020/2/32020/12/210 か月0
B2020/11/114 か月1
生存時間分析機械学習モデルによって生成された顧客生存率曲線
図 1: 生存率曲線

上の図のように、顧客Bの契約期間を4か月として進めることができますが、これは生存時間の過小評価につながります。この問題は、生存時間分析を使用する場合、打ち切りが考慮されるので軽減されます。

実運用における生存時間分析の活用

打ち切りを考慮した後、生存分析機械学習モデルの主要な出力は生存率曲線です。生存率曲線は、X軸に時間を、Y軸に生存確率をプロットします。0か月から始まるこのグラフでは、「顧客が少なくとも0か月間滞在する確率は100%である」と解釈することができます。これは、ポイント(0,1.0)で表されます。同様に、生存率曲線を中央値(34か月)まで下げると、33か月間生存している顧客が、34か月以上生存する確率は50%であることを示しています。ただし、ここでは「33か月間生存している場合」としての条件付き確率であることにご注意ください。

生存率曲線を視覚化することは、モデルの構築や、推論のためにモデルを分析する際に特に役立ちます。しかし、多くの場合、最終的な目的は、生存時間分析モデルの出力を別のモデルの入力として使用することです。例えば、このソリューションアクセラレータでは、生存時間分析モデルの出力を、顧客生涯価値を計算するための入力として使用し、3年間の時間軸の中で、特定のユーザー集団の正味の現在価値を視覚化するアプリケーションを構築します。これにより、さまざまな新規顧客獲得キャンペーンの投資回収期間を把握することができるため、このアプリはマーケティング担当者にとって非常に有効です。同様に、このソリューションアクセラレータで構築した生存時間分析モデルの出力を利用して、顧客がカスタマージャーニーの段階に合わせたマーケティングメッセージを調整することもできます。

このようなユースケースを本番環境で実現するための実際のリファレンスアーキテクチャは下の図のようになります。

顧客の離脱予測ユースケースを実現するための推奨される分析アーキテクチャ

まずはここから

このソリューションアクセラレータの目的は、顧客維持のユースケースに、生存時間分析をできる限り迅速に活用できるようにすることです。そのため、このソリューションアクセラレータには、生存時間分析に一般的に使用される手法であるカプランマイヤー法、コックス比例ハザードモデル、加速故障時間モデルについての詳細な検証が含まれています。

また、オンデマンドのWebセミナー「Survival Analysis in Telecommunications」(通信業界における生存時間分析)も是非ご覧ください。