天天看點

專訪陳磊:拍拍信與金融資料AI

專訪陳磊:拍拍信與金融資料AI

陳磊:

拍拍信(ppcredit)資料科學副總裁, 上海交通大學ee碩士,曾任職ebay分析經理,opera solutions分析總監。作為資料行業老兵,擁有超過十年的資料管理和統計挖掘經驗,為電信、零售、金融等行業客戶提供端到端資料分析和産品解決方案,在資料+技術驅動業務領域有豐富的積累。

大綱:

普惠金融的發展遇到移動化的浪潮,使得消費信貸迎來了高速攀升期,同時也給風控帶來了巨大的挑戰,即在額度區間廣、借貸頻次高、客群下沉情況下,如何實作風險可控、差異化定價、快速審批。幸而大資料和ai技術使得這一切變為可能,拍拍信一直在做這方面的探索,旨在整合資料資源、充分發掘資料潛在價值,幫助金融機構夥伴搭建和優化風控系統,我們将在會上分享相關的實踐經驗和落地案例

archdata技術峰會将于9月9日上海徐彙cocospace開幕,在大會之前,中生代技術特邀專家記者王公仆對陳磊總做了會前訪談

陳總您好,首先感謝您花費寶貴的時間來參加archdata峰會,給大家分享拍拍信業務中的ai技術話題,正式會議前,我這裡有一些問題想請教您

王公仆:之前在杭州地鐵上看到過拍拍貸的廣告,能簡單介紹下拍拍信公司,目标客戶和主營業務嗎?

陳磊:拍拍信資料服務(上海)有限公司成立于2016年3月8日,始終秉承着“專注,服務,創新”的态度,以“資料定義未來,信用改變中國”的理念,緻力于幫助客戶解決資料應用和風險控制問題,并不斷優化疊代我們的技術與服務,為客戶帶來更好體驗。目前客戶主要分布于金融行業,如網際網路金融平台和消費金融持牌機構,主營業務包含但不限于信貸評分、定制化模型、信貸全流程解決方案和系統、反欺詐知識圖譜。

王公仆:請您簡單介紹下在拍拍信内部,ai技術被用在了哪些産品或業務中,效果如何?

陳磊:目前ai技術主要被用于以下幾個方面:

信貸模型:基于深度學習的特征提取,相對于傳統的專家經驗提高了自動化和可擴充性,同時使得高階特征的提取成為可能,最終模型性能有大幅提升;

圖像識别:身份證資訊提取和銀行卡識别,幫助客戶實作風控流程的自動化;

知識圖譜:複雜網絡的識别和挖掘,已被應用于欺詐團夥的識别。

王公仆:作為金融行業的信貸公司,請問你們是怎樣進行信用模組化的呢,原始資料從哪裡擷取呢?

陳磊:我們目前的定位是有深厚金融業積累的資料服務公司:

拍拍信可以提供客戶标準化的信貸評分,也可以根據客戶的需求來定制化信貸評分;

整個的模型周期基本包含資料收集, 資料清洗, 特征工程, 模型訓練, 模型驗證與疊代,模型上線後的自學習也是我們的一大特色;

資料來源主要包含:

a.自有積累資料

b.合作方的授權資料

c.有定制化需求客戶提供的脫敏資料

王公仆:在金融信貸領域,風險控制需要做哪些工作呢?

陳磊:風控覆寫使用者的整個生命周期貸前/貸中/貸後:

貸前的稽核和授信;

貸中的異常監控;

貸後可能的催收。

王公仆:線上上的信貸業務,會遇到哪些信貸方面的挑戰和業務機遇?

風險相對于線下增大,線下信貸客戶真實性可控;

資料次元更多,但稀疏;

使用者體驗需求高,進件規模大,對自動化的要求高。

王公仆:在金融特别是風控的資料模組化/資料研發方面貴公司是如何利用機器學習和大資料進行創新的呢?

先進算法的應用,如boosting、deep learning;

大資料平台的建設,spark叢集,打通資料流和工作流。

王公仆:在大資料方面,貴公司擁有的資料量級是多大呢,一般是用哪種技術存儲和計算的呢?

陳磊:目前資料在百億級,約100t。用hdfs/hbase存儲,及hive/impala/spark進行計算。

王公仆:在資料可視化方面,貴公司是如何做技術選型的呢?

陳磊:前端以e-chart為主考慮到公司處于創業初期,是以選擇開源技術,再加上一部分自主研發。

比如報表系統我們使用pentaho,多元分析使用kylin+saiku,然後自主研發的資料門戶網站等。

王公仆:最後請問在資料安全領域,貴公司是如何保障客戶資料隐私安全的呢?

陳磊:會從多個層面來保證資料安全,比如系統隔離、資料加密及脫敏。

王公仆:最後感謝您接受采訪,謝謝。

原文釋出時間為:2017-09-01

本文作者:王公仆

本文來自雲栖社群合作夥伴“中生代技術”,了解相關資訊可以關注“中生代技術”微信公衆号

繼續閱讀