天天看點

知識圖譜在風控的應用簡述

本文講的是<b>知識圖譜在風控的應用簡述</b>,從校内到人人,微信到陌陌,我們早已熟悉各式各樣“你可能認識的人”,”六度空間”理論早已深入人心。社交軟體通過不同人的社會特征将大家關聯到一起形成一個龐大的社交網絡。同樣,在電商的客戶裡我們有上億各種類型的使用者,我們是否可以分析出他們之間的關系?這些使用者裡有好人也有黑産,我們是否能從這些關系裡推斷出誰可能是正常使用者,誰可能是黑産,進而将這些資料應用到風控中,進而識别潛在的風險交易?我們嘗試将“六度空間”映射到風控領域,建構一個使用者知識圖譜。

2012年以前的語義web中描述一個人可以是“23歲”,”男”,”江蘇人”,“三多”“許三”,這些描述都映射到“許三”,許三被稱作“本體(ontology)”。“許三-性别-男”這樣的“資源-屬性-值”的描述方式稱之為RDF(資源描述架構)。當我們建構無限多個像許三這樣的本體之後就形成了一個本體的集合,就可以研究“屬性-本體”,“本體-本體”之間的關系,他們可以兄弟也可以是父子,甚至可以判斷外号三多和許三是同義,代表同一個人,這樣就形成了一個人與人之間的關系網絡。

2012年,google推出了知識圖譜,知識圖譜的本質還是語義web,将本體從學術引入到應用。知識圖譜建構了一個基于圖的資料結構,将現實世界的實體(學術本體)關系通過點和邊來描述,實作了一種更有效的展示本體之間關系的網絡,也給我們提供了一個通過關系去分析問題的方式。簡單來說,知識圖譜就是把所有資料資訊通過關系連接配接在一起形成的一個關系網絡。

在風控領域裡,我們嘗試用知識圖譜去描述兩個人張三和李四,當張三和李四曾經都使用同一個收貨手機,那麼我們可以通過手機來為兩個人建立一個關系,如下圖:

知識圖譜在風控的應用簡述

在風控領域我們描述一個使用者有以下常用屬性:使用者id,注冊手機,注冊時間,注冊ip,登入ip,登入時間,收貨手機,收貨位址,裝置指紋,實名資訊,銀行卡,支付資訊,行為資訊等。

概括出來,知識圖譜在風控領域的應用主要分為以下幾個部分:

簡單舉例,實際情況比示例要複雜的多。

1.關聯識别

1)關系識别

匿名使用者與登入使用者

匿名使用者A與登入使用者B擁有相同的裝置指紋,用戶端資訊等,可以初步推斷匿名使用者A與登入使用者B是同一人,若A有風險行為,則B的操作不可靠。

知識圖譜在風控的應用簡述

2)行為識别

撞庫行為識别

使用者賬号A,B,C……等賬号在同一個時間段内在同一個裝置上有嘗試登入的行為,可以推斷此時存在撞庫風險,對此時登入成功的賬号應發起改密提醒。

知識圖譜在風控的應用簡述

2.聚類識别

由于資源的有限,黑産總會最大程度利用資源,在很多不同的注冊,登入,下單的場景中,看似獨立的每個使用者可能因為共享有相同的手機号碼,登入ip,下單ip等資訊而形成一個聚合集體,這個集體很容易從知識圖譜中識别出來。

在應對刷單的場景中,黑産為了能夠收到刷到的商品會将收貨位址標明在某個固定的區域内便于降低收貨成本,通過對收貨位址的區縣聚類,可以形成一個以地理位置為次元的知識圖譜,通過對圖的規模識别來反映刷單風險。

知識圖譜在風控的應用簡述

3.推導識别

使用者賬号A與B擁有相同的手機号,使用者賬号B與C擁有相同的收貨位址,則可以推導A與C是存在關系的。如果在某個營銷活動裡,使用者A推薦了B,B推薦了C,C推薦了D,如果判定A為黑産則可以推導這個圖的節點上所有使用者都疑似為黑産。

金融風控領域,在貸後催收過程中如果被催收人A失聯,可以通過知識圖譜找到與A關系相近的其他人,進行追蹤。

知識圖譜在風控的應用簡述

4.異構識别

在一個時間段内使用者A的知識圖譜的關系結構有較大的變化,有關系的斷開也有關系的變更,就要關注這部分使用者的資訊變化,識别潛在的風險。

5.碰撞檢測

同一個時間,訂單1收貨手機A對應的收貨人姓名為許XX,訂單2收貨手機也為A但是收貨人姓名為李XX,則A的手機歸屬人存在沖突,存在潛在的風險。

在金融領域,使用者填寫個人資訊,公司資訊的時候,可能存在虛假資訊,比如A填寫的公司為G1,位址為“上海市閘北區”,公司電話為“021XXXX”,使用者B填寫的公司也為G1,位址卻為“上海市闵行區”,公司電話為“021YYYY”,此時同一個公司有有兩個位址和電話,可以判斷為資訊沖突,需要核實兩個位址是否為同一公司。

知識圖譜在風控的應用簡述

6.同義檢測

在使用者填寫資訊中如已确定“唯品會”與“四行天地”為已知正确關系,如其他使用者填寫“唯品會(中國)”與“四行天地”,通過相似度比對可以認為“唯品會”與“唯品會(中國)”為同義詞。之前我們提到,在RDF中可以建構一個同義詞的關系,用知識圖譜建立該關系,可以在碰撞檢測中去除掉一部分同義詞産生的碰撞,使結果更加的準确。

了解了應用場景,下一步就是将理論上升到實踐中啦。

原文釋出時間為:2017年4月25日

本文來自雲栖社群合作夥伴嘶吼,了解相關資訊可以關注嘶吼網站。

<a href="http://www.4hou.com/technology/4476.html" target="_blank">原文連結</a>

繼續閱讀