使用者流失預警風控

2019-12-10 23:50:00

業務背景

在業務發展過程中有兩個重要的環節，一個是拉新，另一個是留存。如何做到使用者的留存需要很多技術手段保證，一個比較重要的方式是建立使用者流失模型，通過學習曆史上流失使用者的特點，通過機器學習的手段訓練處風控模型，隊可能會流式的使用者進行預測，然後可以提前通過營運手段做一些使用者流失的防範。

業務痛點

目前使用者流失預警監控是業内主流的需求之一，但是缺少智能化的預測手段和機制。目前主流的一些預警方案都是基于一些規則的方案，對于一些潛在可能流失的使用者沒有很準确的發掘手段。

解決方案

PAI平台提供了一套基于打标資料的特征編碼、分類模型訓練、模型評估的方案。

1.人力要求：需要具備基礎的模組化背景知識

2.開發周期：1-2天

3.資料要求：最好有超過千條的打标資料，打标哪些客戶在哪種特征情況下流失過，資料越多效果越好

資料說明

資料來自真實的電信領域客戶行為資料，包含使用者的基本屬性以及使用者是否會流失，資料一共7043個使用者樣本。

特征資料：

參數名稱	參數描述
customerid	使用者ID
gender	性别
SeniorCitizen	是否是個市民，1是，0不是
Partner	是否有Partner
Dependents	是否有從屬關系
tenure	客戶在這個公司使用的時長
PhoneService	是否有手機服務
MultipleLine	是否有多條線路
InternetService	網際網路服務商DSL、Fiber optic、No
OnlineSecurity	是否有網際網路線上安全問題
OnlineBackup	是否有線上支援
DeviceProtection	是否有服務保護
TechSupport	是否申請過技術支援
StreamingTV	是否有流TV
StreamingMovies	是否有流電影
Contract	合同時限，Month-to-month、Two year
PaperlessBilling	是否有電子賬單
PaymentMethod	付款方式
MonthlyCharges	月消費
TotalCharges	總消費

目标資料：


churn	使用者是否流式

流程說明

進入PAI-Studio産品：

https://pai.data.aliyun.com/console

該方案資料和實驗環境已經内置于首頁模闆：

打開實驗：

1.資料源

上文提到的使用者流式使用者的資料

2.特征編碼

通過One-hot以及SQL元件實作特征工程模組化，将原始的字元型特征轉為數值型特征。

以目标字段churn為例，原始資料是“Yes”和“No”，可以通過SQL語句把"Yes"變為1，“No”變為0：

select (case churn  when 'Yes' then 1 else 0 end) as churn from  ${t1};

3.模型訓練

将資料分成兩部分，一部分作為訓練集訓練模型，另一部分做預測集驗證模型效果。使用者流失預警是個二分類問題，一個使用者隻有流失和不流失兩種可能性。是以選用二分類算法來處理，生成的分類模型可以一鍵部署為RestfulAPI服務供業務方調用。

4.模型效果驗證

通過二分類評估元件驗證模型準确性，準确性描述名額AUC可以達到0.83，也就是說預測的準确性在80%左右。

總結

使用者流失預警是所有B端客戶都可能應用到的場景，PAI提供了一套完整的基于使用者特征的算法，可以幫助客戶在1-2天快速實作使用者流失模型的訓練，大大提速了整個實驗搭建的周期。>

使用者流失預警風控

業務背景

業務痛點

解決方案

資料說明

流程說明

總結

繼續閱讀

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

關于SQL語言

SQL語言基礎：常用的資料查詢語句

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

neo4j之cypher使用文檔

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

【python】【資料處理】畫多元資料分布圖

sqlServer根據經緯查距離

hdu7108哈希