Engineering blog

カスタマーリテンション(顧客維持)による LTV の向上と最大化 – ML のハイパーパラメータで解約率を予測

Bryan Smith
Rob Saker
Hector Leano
Share this post

顧客のロイヤルティや維持率が高い企業では、収益が同業他社に比べ 250% 早く成長し、10 年間での株主利益率も 2 倍から5 倍に達します。顧客のロイヤルティを獲得し、定着数を最大にすることは、企業と顧客ベースの両方に多くの利益をもたらします。

ではなぜ多くの企業にとって顧客の維持が難しいのでしょうか?ARPU(顧客 1 人あたりの平均売上高)を指標とする通信会社などのサブスクリプションベースの企業以外は、顧客維持率の公式な開示を重視していない企業がほとんどです。企業では、顧客ではなく製品やサービスの機能面に重点を置き、顧客ロイヤルティはこれらの取り組みによって自然に向上するものと考えています。実際に、ニールセンの 2020 年の調査結果では、「企業のマーケティング目標の中で、顧客離脱・解約への対応の優先度は最下位」であることが明らかになっています。

多くの事実からも、顧客の消費行動が変化していることがわかっており、顧客維持は特に重要な課題です。新型コロナウイルス感染症(COVID-19)による消費行動への影響を指摘する研究も多くありますが、実際には、新型コロナウイルスによるパンデミック以前から、顧客のブランドロイヤルティへの関心の低下傾向は始まっていました。

LTV(ライフタイムバリュー:顧客生涯価値)の重要性

長期的な成長を見据えるのであれば、顧客維持を重要視すべきです。最近の投稿で、サブスクリプションモデル非サブスクリプションモデルにおける顧客の生涯価値(LTV: Life Time Value)について解説しましたが、顧客との関係を利益につながるものとするには、顧客維持の果たす役割を無視することはできません。顧客との関係は、少なくとも企業が関係構築に要した費用を回収できるまでは継続する必要があります。そして、さらにそれ以上の利益をもたらす関係が理想的です。

カスタマージャーニーのさまざまな段階での解約
図 1. 顧客ジャーニーのさまざまな段階での解約

顧客維持(カスタマーリテンション)を適切に管理し、顧客の離脱・解約率を低下させるうえで鍵となるのは、顧客のライフタイムが通常どのように進行(図 1)し、どの時点で顧客離れが生じるかを把握することです。ライフタイムの初期の頃は、顧客はまだ利用する製品やサービスについて知り、メリットを得る方法を確認している段階です。このようなメリットを最大限に引き出そうとする顧客の行動に対しては、事前に働きかけを行って積極的に採用を促すことが、その後の継続的な製品利用につながっていきます。そして、その後の段階においては、ブランド認知を確立することで継続的にロイヤルティを高めていくだけでなく、周囲にブランドのことを広めてくれるような「アンバサダー」となってもらうことも見込めます。そのような熱心なファンを得ることで、口コミを通じた新しい顧客の獲得や、スムーズなサービス利用などの効果も期待できます。

顧客離脱の理由を把握する

顧客との関係が失われる際には、その理由を把握することが重要です。離脱の理由には、長期間にわたる関係が自然な経過を経てついに終了ということもあるでしょう。そのような場合には、自社やパートナーの他の製品やサービスを紹介することで、引き続き顧客との関係を維持していくことが可能です。もしくは、無理に引き留めるようなことはせず、その後も自社製品に愛着を抱いたままでいてもらうのもよいでしょう。

顧客の離脱が通常よりも早く起きてしまう場合には、何らかの対応が必要です。ライフタイムサイクルの早い段階で顧客離れが起きるということは、製品やサービスの利用になにか問題があるか、メリットを感じてもらえていない可能性があります。後の段階で起きている場合には、製品やデリバリーの変更または競争環境の変化により、実際にメリットが低下したか、そのように受け止められている価値の減少の可能性があります。また、どの段階においても、クレジットカードの期限切れが把握できていないなどの業務プロセスの問題が原因で、気づかないうちに顧客離れが生じることもあります。このように、顧客の離脱の原因はそれぞれの状況によって大きく異なるため、個人レベル、組織レベルごとに異なる対応が必要になります。

考慮すべきこと 

個々の顧客レベルで対応を行う場合は、対応に関わるコストと便益について考慮することが大切です。どの顧客からも、ライフタイム全体を通じて利益を生み出せる可能性がありますが、顧客離れを防ぐために、プロモーション、割引、その他のインセンティブを用いる場合は、期待する残存価値(ターミナルバリュー)を上回ることがないようにしなければなりません。利益の維持を常に心掛けるべきです。

このような熟慮が必要となるのは、個々の顧客生涯価値(LTV: Life Time Value)についてだけではありません。顧客維持のためのキャンペーン費用全体についても同じことが言えます。顧客を維持するための計画、管理や継続的なエンゲージメントに関連する人件費は、離脱リスクがある顧客の価値とバランスが取れている(理想的には、価値が大きい)必要があります。

とはいえ、カスタマーリテンション管理戦略の実施について消極的になることはありません。実際に、多数の調査結果において、既存顧客の引き留めよりも新規顧客の獲得に 5 倍以上のコストが必要とされています。また、顧客離れを 5% 減らすことで利益が 95% 増加するとの報告もあります。つまり、顧客離れの背後にあるマクロレベルのパターンを把握して、慎重に対処することで顧客維持の阻害要因を減らしつつ、離脱リスクの高い顧客に対しては選択的に対応する必要があります。そして、そのような戦略を推し進めるうえで効果を発揮するのが、機械学習と予測分析です。

GBDT などの機械学習を活用した解約率(チャーンレート)の数値化 

顧客離れの兆候は、顧客のさまざまなアクティビティの中にまぎれてしまい、なかなか特定できません。顧客離脱の防止には、大規模な時系列データを精査し、詳細な通知を一定数受け取れるようにする必要があることから、機械学習モデルの導入が最適です。

ロジスティック回帰や決定木分析などの従来の手法を利用することもできますが、顧客離脱の発生頻度が少ないと適切に検出できない可能性があります(図2)。ニューラルネットワークや GBDT(勾配ブースティング決定木)などの最新技術を活用したハイパーパラメータの導入を行うことで、顧客離れを示すわずかなパターンの変動をより高い精度で抽出できます。ただし、利用するには慎重な設定と評価が必要です。

実際のデータセットでは、顧客離脱が生じているケースと生じていないケースのサンプル数が大きくかけ離れている
図 2. 実際のデータセットでは、顧客離脱が生じているケースと生じていないケースのサンプル数が大きくかけ離れている

適切な機械学習モデルを用意するには、顧客が「離れるか離れないか」を判別しようとするのではなく、顧客離脱の予測に伴う不確実性を受け入れるべきです。顧客離れの可能性がある全ての顧客に対してリスクを数値化して評価しておくことで、予測結果から不確実性を取り除くことに専念できます。顧客離脱のリスク予測について経験を深め、ハイパーパラメータの信頼性を向上させることができれば、個々の顧客を対象に生涯価値の残存価値(ターミナルバリュー)を精査し、関与すべき対象やそのタイミング、方法を適切に決定できるようになります。

データブリックスの導入で具体的な成果を得る

機械学習やデータサイエンスは簡単なものではありません。専用ソフトウェアを使ったデータの利用、モデルを繰り返し処理するためのインフラ管理、解析結果の実業務での運用など、相応の手間がかかります。機械学習やデータサイエンスの導入が効率的な業務の妨げとなるべきではありません。

データサイエンティストが必要な機能を迅速に利用できるようにするには、最もよく使われる機械学習ライブラリをプラットフォームにあらかじめ統合した、クラウドベースの伸縮自在なインフラストラクチャを活用すべきです。事前に統合された hyperopt や mlflow などのフレームワークを使用すれば、かつては時間のかかる煩雑な作業であったモデルパフォーマンスの最適化や設定が自動で行えます(図3.)。また、動的スケーリングが可能な高性能のデータ処理エンジンを活用することで、顧客離脱の兆候を含んだ大量のデータを迅速かつ効率的に分析できます。

各種ハイパーパラメータ値とモデル精度の関連
図 3. 各種ハイパーパラメータ値とモデル精度の関連

顧客離脱・解約率(チャーンレート)の予測分析に取り組むうえで、上記の各機能をどのように組み合わせればいいか確認するには、以下のソリューションアクセラレータをご覧ください。ローデータの処理方法から、実際のデータを活用した予測の方法までが確認できます。

Get the notebooks
Databricks 無料トライアル
See all エンジニアリングのブログ posts