天天看點

每經專訪騰訊雲天禦首席科學家李超:金融機構更願意使用大模型去建構更穩定的定制化模型

作者:這是憤世嫉俗的

每經記者:潘婷 每經編輯:張益銘

年初,ChatGPT的的橫空出世引發一系列AI領域的連鎖反應,大模型如何才能和各行業結合,解決産業難題成為各界關注的焦點問題。金融行業作為天然資料密集型行業,也是人工智能應用最早和最普遍的行業,加之金融機構從高利率高風險的營運模式轉化為精細化的營運模式,獲客方式、風控政策差異化加大,這也導緻風控領域成為觀察大模型落地的重要場景。

金融風控由“規則對抗”進入“模型對抗”怎麼了解?不同金融機構對大模型的接受程度如何?風控大模型對于金融機構風控性能的提升有沒有一些可以量化的名額來評判?風控大模型是如何嵌入金融機構場景的?帶着上述問題,每日經濟新聞記者專訪了騰訊雲天禦首席科學家李超,以下NBD代表每日經濟新聞。

每經專訪騰訊雲天禦首席科學家李超:金融機構更願意使用大模型去建構更穩定的定制化模型

騰訊雲天禦首席科學家 李超 受訪者供圖

金融機構不僅要靈活疊代政策,還要疊代模型本身

NBD:金融風控由“規則對抗”進入“模型對抗”是怎麼了解的?

李超:“模型應用,産業先行”正在成為大模型應用的共識,這在金融行業展現的尤為明顯。金融行業作為天然的資料密集型行業,又是人工智能應用最早和最普遍的行業,無疑是大模型落地的最佳場景。但金融行業對資訊的高精度的要求和嚴苛的資料合規要求,讓行業大模型在金融場景的落地需要貼合自身發展現狀。

作為金融行業的“命門”,風控基本完成了從人工稽核到智能風控的變化。由于貸款業務線上化、數字化以後,人工審批的效率遠遠不能滿足業務發展,于是以機器學習模型為代表的人工智能稽核成為金融風控的重要手段和構成部分。風控模型就是把專家經驗抽象成一系列風控政策集,提升判斷風險的效率。譬如欺詐檢測模型、準入模型、風險定價模型、額度管理等貫穿金融信貸業務的全生命周期。可以說,風控模型是金融風控體系的技術核心。

傳統的風控模型主要依托于金融機構的曆史金融資料和專家經驗,呈現出“靜态模型+動态政策規則”的特征,即整體風控模型的架構不變,調整具體政策的門檻值,例如以前針對有過三次逾期記錄的使用者申請不予通過,現在有可能根據欺詐态勢調整為有過一次逾期記錄的才不予通過。但在金融機構面臨的内外部趨勢變化下,金融機構不僅要靈活疊代政策,還要疊代模型本身,建構以“動态模型+動态政策規則”為代表的“模型對抗”能力。

NBD:做大模型要有海量的資料,那我們的資料來源有哪些?是由金融機構授權後我們再去針對性的模組化,還是會有一個普适性的模型去應對?

李超:關于大模型這件事,目前在行業裡邊讨論的比較多的是大語言模型(LLMS),就是ChatGPT,也是讓這件事情得到大家更深入的關注。ChatGPT本身是一個大語言模型,它是無監督的自然語言處理分析的模型,用來解決聊天機器人這樣一些場景。

今天我們讨論的金融風控大模型,依托騰訊雲行業大模型和騰訊安全20多年黑灰産對抗經驗沉澱,主要解決的問題并不是偏文本分析的場景,而是關于金融風控的欺詐識别大模型,本身是機器學習模型,并不是大語言模型。這個東西在訓練的時候,更多應用了金融風控場景裡面特有的風控樣本。

我們最早做定制化服務的時候,其實并沒有通過大模型,也就是基于Foundation model+遷移學習的機制,客戶會根據自身客戶收集的樣本來去建構垂直場景的風控模型。雖然能夠實作定制化的欺詐模式識别,但是在這過程中也發現通常客戶自身積累的樣本能力和速度是非常局限的,單純用傳統的機器學習方式給客戶做模型的建構,很難去建設好既精準又穩定的風控模型。

基于我們在人工智能算法不斷的深入研究,開始用到遷移學習的機制,逐漸發展到成為新一代基于大模型的模型對抗範式。它最主要的特點就是能夠根據過往我們所積累的黑灰産一些樣式和一些模型,把其中有用的知識通過知識蒸餾的方式收取出來,通過技術的手段,把這些知識形成基礎模型,叫做Foundation model,Foundation model不同于一個通用模型,不需要直接去服務具體的場景,而是一個知識庫。在這個“知識庫”基礎上,客戶基于一些樣本提示,就能夠靈活地生成适配各個場景和不同金融機構的風控模型。

大模型助力金融機構風控模組化:反欺詐效果提升20%,模組化時間縮短90%

NBD:風控大模型對于銀行、消金、互金這些金融機構風控性能的提升有沒有一些可以量化的名額來評判?

李超:客戶通過金融風控大模型來建構風控模型相比傳統的風控模組化方案,一般會有20%左右的反欺詐效果提升,模組化時間也就是從樣本收集、模型訓練到部署上線的過程從以前的2周到現在僅需要2天。

另外,大模型讓定制模組化變得更加可行。在客戶樣本非常少或者沒有的情況下,我們也能進行定制模組化,同時這種定制模組化的穩定性會比傳統模型更穩定、更可用。是以這種大模型的核心價值,更多是使定制模組化成為可能。

以某金融客戶為例,模組化效率提升60%。該金融機構自身管道和客群變化比較快,客戶的風控團隊遵循風險動态治理的風控理念,需不斷根據風險的變化疊代風控模型。然而基于傳統的專家聯合模組化方式在效率和成本上都難以滿足客戶需求,騰訊雲助力該客戶實作了全流程自動化的風控模組化,模型疊代周期從17天縮短到3天,風控模型疊代效率得到了極大的提升。

另外,某銀行客戶在小樣本條件下模組化性能提升20.5%,該客戶因業務冷啟動階段欺詐樣本積累不足,在風控模組化階段面臨小樣本訓練難題,傳統風控模組化方式難以滿足客戶對模型性能的要求。使用金融風控大模型,客戶基于少量提示樣本就遷移得到适配自身業務場景的定制模型,相比于傳統的模組化方式模型KS(Kolmogorov-Smirnov,區分度)性能提升20.5%,在跨場景的泛化性測試上性能提升53%。

NBD:這個模型具體是怎麼運作的?怎麼嵌入金融機構場景的?

李超:我們首先是用一種對抗學習的方式把所有模型裡面的有用知識抽取出來,再通過知識蒸餾的方式把這些有用的知識融合進一個Foundation model,基于這個大基礎模型就能夠快速生産出來新的模型。

當過往的知識越來越多的時候,對于場景樣本的需求就會越來越少。大模型的整個邏輯,就是把過往所有知識全部加工在Foundation model裡,這個Foundation model好比一個能夠自動生産模型的機器人,隻需要給它小量的場景樣本提示,就能夠生産出來對應場景的專屬模型出來。生成的模型既有比較好的場景欺詐識别效果,又具備了通識能力,即模型泛化性。

從金融場景整體來看,目前更多場景是以貸前為主,貸中逐漸多了起來,貸後遇到的相對還是少一些。比較有代表性的是一些消金、互金公司,他們對審批流程做了很精細化的管理之後,在審批流程的很多環節都開始應用AI模組化形式。是以也就有了定制模組化的需求,貫穿在客戶風險審批整個生命周期,比如反欺詐、客戶分層、撈回、定額、定價,在很多環節都可以用大模型定制的方式。

不同金融機構的風控模組化需求和挑戰

NBD:在服務金融機構過程中,比如說銀行、消金、互金,在服務的過程中,他們對于風控大模型的需求有沒有哪些異同點是比較突出的?

李超:以我的經驗來看,互金和消金對于新技術的應用比銀行會更早一點,相對來說銀行會更晚進入新技術應用的時期。

目前我們看到的是,整個銀行業已經開始應用機器學習,不再像過去那樣單一傳統的線下手段或者評測的手段,已經廣泛應用到機器學習模型評分機制,但是很多還沒有建立起真正的靈活疊代的動态風險管理疊代機制。當一個風控模型上線之後,不會輕易去進行更新。

互金公司的模型定制化需求是非常旺盛的,更願意去嘗試新的模型,消金介于銀行和互金之間。很多互金公司、消金公司,他們的模型疊代非常快,有些3個月或者1個月就會疊代。很多互金公司,對不同金融産品不同管道不同業務流程,都會做很多定制化的模型。

最近一年,很多金融機構已經開始意識到小樣本的問題,他們發現定制出來的模型很快就會效果衰竭,是以模型需要非常快速的疊代,很大的原因就是小樣本問題。

大模型出來後,很多金融機構更願意使用大模型去建構更穩定的定制化模型,我們會把泛化能力更強、更廣泛、多樣化的資訊給融合在模型裡,消金、互金更多會使用大模型機制去實作模型快速疊代。

每日經濟新聞

繼續閱讀