天天看點

PDFMV架構的P

以下文章來源于資料思踐 ,作者王路情

這是我的第54篇原創文章,關于PDFMV架構。

閱讀完本,你可以知道:

1 PDFMV架構的P是什麼

PDFMV架構是“問題-資料-特征-模型-價值”英文字母的縮寫,是一個閉環的系統,具有持續性疊代優化的功能。

PDFMV架構的P是“Problem”的縮寫,表示“問題”。關于P的認知,如下圖所示:

PDFMV架構的P

1

Why-Problem

對于問題,我們首先要問“為什麼”。

  • 為什麼要提出這個問題?
  • 為什麼要研究這個問題?
  • 為什麼要解決這個問題?

我們可以從問題的價值性來看待“Why-Problem”。我們可以進一步探讨:

  • 問題有價值和意義嗎?
  • 問題的價值可以量化嗎?
  • 問題的受益者是誰?
  • 問題的風險和回報分析是什麼?

總體原則,我們是在有價值的問題導向下開啟資料科學項目。

PDFMV架構的P

2

What-Problem

我們清楚問題為什麼後,是時候考慮“What-Problem”了,簡稱為“問題的定義”。

關于問題的定義,我們需要:

1 具體化,問題描述越具體,說明對問題了解越透徹,意味着能夠更有效地解決問題。

2 合理化,我們要清楚所提出問題的基準線是什麼,期望值是什麼,所出背景和現狀是什麼,立足當下,實作增進。

3 數字化,問題所涉及的關鍵名額采用數字量化。

PDFMV架構的P

3

How-Problem

我們怎麼解決好問題,這是“How-Problem”需要回答的。

我們要做問題細化的工作,直到問題不能再分解。我把它稱之為“分解的哲學”。老子說,“天下難事必作于易,天下大事必作于細。是以聖人終不為大,故能成其大。”

面對任何要解答的問題,我們首要是做好充分細化後,就可以采用靈活開發的模式和疊代優化的方式來快速響應問題和高效破解問題。

PDFMV架構的P

4

舉例說明

智慧金融領域的使用者申請評分

1 Why-Problem

使用者申請評分通過一個分數量化使用者的違約風險機率,幫助做風險控制,提升信貸效率,顯然這個問題是有價值的,解決好這個問題也是必要的。

2 What-Problem

對一款信貸産品的申請使用者,進行信用評分,信用評分的可靠性名額KS不少于30%,穩定性名額PSI不超過0.05。

3 How-Problem

解決好這個問題,我們要做這些細化工作。

第一步:使用者群的鎖定,目标标簽的界定,樣例的收集

第二步:資料的探索和分析,變量的分箱,特征的選擇

第三步:模型的建構和評價

第四步:違約機率到分數刻度的轉換

做好細化工作後,我們選擇合适的工具,就可以去解答這個問題了。在解答的過程中,我們采用靈活開發的模式和疊代優化的方式,以讓這個評分更加可靠和穩定。

關于PDFMV架構的P,您有什麼疑問或者想法請留言。