天天看點

使用者流失預警風控

業務背景

在業務發展過程中有兩個重要的環節,一個是拉新,另一個是留存。如何做到使用者的留存需要很多技術手段保證,一個比較重要的方式是建立使用者流失模型,通過學習曆史上流失使用者的特點,通過機器學習的手段訓練處風控模型,隊可能會流式的使用者進行預測,然後可以提前通過營運手段做一些使用者流失的防範。

業務痛點

目前使用者流失預警監控是業内主流的需求之一,但是缺少智能化的預測手段和機制。目前主流的一些預警方案都是基于一些規則的方案,對于一些潛在可能流失的使用者沒有很準确的發掘手段。

解決方案

PAI平台提供了一套基于打标資料的特征編碼、分類模型訓練、模型評估的方案。

1.人力要求:需要具備基礎的模組化背景知識

2.開發周期:1-2天

3.資料要求:最好有超過千條的打标資料,打标哪些客戶在哪種特征情況下流失過,資料越多效果越好

資料說明

資料來自真實的電信領域客戶行為資料,包含使用者的基本屬性以及使用者是否會流失,資料一共7043個使用者樣本。

使用者流失預警風控

特征資料:

參數名稱 參數描述
customerid 使用者ID
gender 性别
SeniorCitizen 是否是個市民,1是,0不是
Partner 是否有Partner
Dependents 是否有從屬關系
tenure 客戶在這個公司使用的時長
PhoneService 是否有手機服務
MultipleLine 是否有多條線路
InternetService 網際網路服務商DSL、Fiber optic、No
OnlineSecurity 是否有網際網路線上安全問題
OnlineBackup 是否有線上支援
DeviceProtection 是否有服務保護
TechSupport 是否申請過技術支援
StreamingTV 是否有流TV
StreamingMovies 是否有流電影
Contract 合同時限,Month-to-month、Two year
PaperlessBilling 是否有電子賬單
PaymentMethod 付款方式
MonthlyCharges 月消費
TotalCharges 總消費

目标資料:

churn 使用者是否流式

流程說明

進入PAI-Studio産品:

https://pai.data.aliyun.com/console

該方案資料和實驗環境已經内置于首頁模闆:

使用者流失預警風控

打開實驗:

使用者流失預警風控

1.資料源

上文提到的使用者流式使用者的資料

2.特征編碼

通過One-hot以及SQL元件實作特征工程模組化,将原始的字元型特征轉為數值型特征。

使用者流失預警風控

以目标字段churn為例,原始資料是“Yes”和“No”,可以通過SQL語句把"Yes"變為1,“No”變為0:

select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};           

3.模型訓練

将資料分成兩部分,一部分作為訓練集訓練模型,另一部分做預測集驗證模型效果。使用者流失預警是個二分類問題,一個使用者隻有流失和不流失兩種可能性。是以選用二分類算法來處理,生成的分類模型可以一鍵部署為RestfulAPI服務供業務方調用。

4.模型效果驗證

通過二分類評估元件驗證模型準确性,準确性描述名額AUC可以達到0.83,也就是說預測的準确性在80%左右。

使用者流失預警風控

總結

使用者流失預警是所有B端客戶都可能應用到的場景,PAI提供了一套完整的基于使用者特征的算法,可以幫助客戶在1-2天快速實作使用者流失模型的訓練,大大提速了整個實驗搭建的周期。>