天天看點

基于海量弱特征的AI風控模型正漸漸到來

在AlphaGo擊敗世界圍棋冠軍、職業九段選手李世石後,人工智能的發展與應用再一次成為人們的視線焦點,同時也引發了人們對人工智能的無限想象。

基于海量弱特征的AI風控模型正漸漸到來

最早提出這一概念的約翰·麥卡錫認為,人工智能就是要讓機器的行為看起來像人所表現出的智能行為一樣。盡管目前對人工智能的定義并未完全統一,但都展現出人工智能效率高、穩定性高、安全性高等特點。在很多領域中,我們已經發現機器有可能超越人類。

人工智能學會主席Ben Goertzel在2015年的博鳌亞洲論壇上認為,十年以後,人工智能可能會介入世界上大部分的金融交易。

目前,人工智能在金融領域的應用已經可圈可點:智能投顧方面,位于美國的世界著名智能投顧公司Wealthfront和Betterment做得有聲有色,Wealthfront 掌控的資金已超過數十億美元;交易預測方面,全球第一個以人工智能驅動的基金Rebellion曾預測了2008年股市崩盤,并在2009年9月給希臘債券F評級,比惠譽提前了一個月。

從金融活動的流程來看,人工智能将可以貫穿全程:在前端應用于服務客戶,在中端支援授信、各類金融交易和金融分析中的決策,在後端用于風險防控和監測,使金融服務更加精細化、個性化,以及效率和風控能力的提升。

可以預見的是,金融變革正在到來,引領這場變革之一的正是人工智能。

傳統金融信貸服務面臨挑戰

在傳統金融尤其是傳統信貸服務領域,資訊、信用、管道、成本等困境正在逐漸顯現。傳統的銀行服務主要依托其網點開展,在業務中極其依賴有無房産、工資流水、征信報告、社保證明等強特征資料,通過這些強金融特征資料篩選出與風險敞口契合的客戶。所謂強特征,即能否獲得信貸服務的關鍵因素。

但事實是,中國有相當一部分人不具備這些強特征資料,進而被排除在銀行服務體系之外。有資料顯示,在我國,傳統信貸能服務的客戶群僅占總人口的15%左右。盡管傳統信貸機構想服務更多的人群,但風控模型的局限性導緻其可望而不可及。

首先,少量的強特征無法全面評估一個人,而每個人在強特征之外還存在成千上萬的弱特征,但傳統信貸的風控模型是基于少量強特征人工智能引領金融變革,并不适用于處理海量的弱特征資料。

其次,傳統信貸服務需要依托線下網點展開,資質稽核、合同簽訂等流程都需面對面進行,服務效率低下。同時,由于人的參與,每個人的經驗、情感狀态等存在差異,其服務的安全性和穩定性必然受到影響。

再次,由于傳統信貸風控模型的資料次元比較單一,其模型的優化、疊代周期較長,一般需半年至一年。這不能适應快速變化的市場壞境,無法有效滿足客戶需求。

人工智能凸顯技術優勢

随着網際網路不斷滲透到生活中,在強特征之外,每個人都會産生成千上萬有價值的海量弱特征資料。

如果把一個人的資料比作一座冰山,那麼強特征資料僅是冰山的一角,之下還存在着海量的弱特征資料,例如電商資料、裝置資料、位置資料等等。

同時,作為百業之母的金融行業與整個社會存在巨大的交織網絡,本身沉澱了大量有用或者無用資料,其中包括各類金融交易、客戶資訊、市場分析、風險控制、投資顧問等。這些資料機關都是海量級,且大量資料又以非結構化的方式存在,無法轉換成可分析資料。

人工智能要做的,就是充分挖掘并有效地利用這些海量弱特征資料。雖然無法憑借其中少數幾條資料就做出借貸決定,但如果把幾百個甚至幾千個次元的資料綜合起來,就可以訓練出有效的風控模型,并以此為風控依據為使用者做出借貸決定。

弱特征和強特征資料的差別在于,強特征是非0即1;而單獨的某一項弱特征,對于使用者的信用評估和逾期率沒有絕對性的指導意義,但很多弱特征放在一起,就能對使用者進行相對精确的評估。

舍恩伯格在《大資料時代》中寫道: “我們沒有必要非得知道現象背後的原因,而是要讓資料自己發聲。”人工智能并不擅長推理,但資料和資料之間的關系都被記錄下來,就具備了邏輯基礎,可以進行深入的推理繼爾産生結果。

目前,人工智能已經廣泛運用于國内外金融領域。人工智能技術已經能夠挖掘多元度的海量資料,建構和優化風控模型,準确且快速地判斷貸款的合理性,進而大大降低了使用者申請送出和資料收集、反欺詐、核心決策授信和模型評分、以及催收等的服務成本。深度學習促使不斷優化在蘋果公司推出Siri之初,很多人都把它當成玩具,認為它沒有真實的用處,會問它諸如“你是男是女”等這種看似無聊的問題。但蘋果公司把這些無聊的問題進行深度分析,了解人們最常問的問題并不斷優化,問題越問越多,蘋果也就可以得到更多的資料,更好地提升其實用性。這便是人工智能的深度學習。

金融領域亦是如此。一個借款人是否還款、有無逾期、是否足額還款等都有相應的特征資料。人腦雖然能識别單個業務,但很難快速處理龐大的資料量,發現其中的邏輯規律并做出高效判斷。人工智能用機器取代了人腦,可學習覆寫的資料範疇極大,處理的效率也極大提高。

随着人工智能在金融層面應用範圍的展開,系統獲得的資料不斷增加,通過對這些資料的深度學習,将更進一步提升自身的風控能力。基于此,與傳統金融機構看中借款額度不同,金融科技公司更加看中借款筆數,因為筆數代表着樣本,代表着能夠讓模型得到更好訓練的資料。

随着人臉識别、指紋識别、虹膜識别、聲紋識别等技術不斷應用于身份驗證和金融反欺詐等業務環節,尤其是随着語義分析、機器學習的技術進步,将進一步加速風控模型的疊代,大幅提升金融業務的自動化水準和個性化的服務效率。

智慧金融時代正在來臨

金融領域“高度資料化、正負樣本清晰、疊代目标明确、容錯率高等”特點讓人工智能天然适合金融領域。

巨大的金融服務空白促使人工智能加速進入,基于人工智能技術的新金融科技公司湧現。它們可充分運用技術,對龐大非銀行人群的海量弱特征資料進行定量風險分析,得到一個連續的風險定價,并在此基礎上提供與之相比對的金融産品與服務。

近兩年來“金融科技”被越來越多的人提起并被諸多公司追捧。盡管這個詞最早由美國提出,但得益于特有的市場和環境,中國“金融科技”正在以前所未有的速度趕超美國,一個由人工智能引領的智慧金融時代正在到來。

一方面,目前國内外人工智能在金融領域的應用已有諸多成功案例。美國的Wealthfront和Betterment、英國的Money on toast、德國的Finance Scout 24、法國的Marie Quantier等均成功将人工智能引入投資理财,目前智能顧問已掌握大量資産;第一個以人工智能驅動的基金Rebellion曾成功預測了08年股市崩盤;掌管900億美元的對沖基金Cerebellum,自2009年使用了人工智能技術以來一直處于盈利狀态。在國内,螞蟻金服已成功将人工智能運用于網際網路小貸、保險、征信、資産配置、客戶服務等領域;智融金服利用人工智能風控系統已經實作月均120萬筆以上的放款,正常機器稽核速度用時僅8秒;招商銀行的可視化櫃台、交通銀行推出的人工智能機器人“嬌嬌”等都是國内金融領域人工智能應用的成功案例。

另一方面,未來人工智能在金融領域的應用極具想象力。高盛、摩根、花旗等國外金融巨頭正在不斷加大人工智能領域的投入。國内更是如此,不少機構通過自建團隊、兼并收購和外部合作的方式涉足人工智能領域。如中國平安、招商銀行、華泰證券等均涉獵了智能投顧、網絡借貸、大資料征信等領域。網際網路巨頭也在紛紛布局,BATJ等網際網路巨頭公司擁有強大的技術、資本、人才、資料實力和優勢,在智能量化交易、智能投顧、智能客服和生物身份識别等新技術應用方面都已進入實戰階段。

人工智能因其更适合進行大規模資料處理的定量分析、不受主觀因素影響,效果更穩定可靠、可根據資料表現快速疊代,自動優化、無道德風險,反作弊能力強、審批效率更高,實時性更好等天然優勢,正在越來越多的被用于金融業的核心業務信貸尤其是小額短期信貸領域。

在投資理财領域,海外咨詢機構科爾尼(A.T.Kearney)2016年曾預計,機器人顧問未來3年到5年将成為主流,年複合增長率将達68%,到2020年其管理的資産規模有望達到2.2萬億美元。花旗銀行研究也預測,人工智能投資顧問管理的資産,未來10年将實作指數級增長,總額将達到5萬億美元。

如今, “網際網路+”對金融的改造已經進入尾聲,而“人工智能+”正風起雲湧。在經過“網際網路+金融”的鋪墊後,“人工智能+金融”似乎來得更快、更猛。

我們不妨想象一下,在不久的将來,人工智能大範圍運用到金融領域,成為傳統金融的有效補充,能夠讓金融業務中的信用分析、風險控制、貸款審批等變得高效而準确,讓每個人都擁有金融的意識、習慣和能力,最終讓金融成為人們的一種生活方式,讓每個人都能享受智慧的金融。

繼續閱讀