天天看點

PINTEC集團璇玑公司CEO鄭毓棟:人工智能的金融應用,一旦賭錯萬劫不複

鄭毓棟,璇玑公司 CEO。擁有 10 餘年跨國銀行的經驗,在财富管理,金融産品開發,高淨值客戶管理方面有豐富的經驗;鄭毓棟先後擔任渣打銀行中國投資政策及咨詢總監,産品總監以及花旗銀行新加坡商務客戶市場及産品總監;并且廣泛在媒體接受采訪,倡導資産配置理念;鄭毓棟擁有新加坡國立大學經濟學碩士和計算機科學學士學位。

關于璇玑的數字化資産配置系統

我們以金融邏輯為主,基于馬科維茨資産組合理論,然後将機器學習和其他方法作為一種支援。

機器之心:能介紹一下我們的智能理财系統嗎?

鄭毓棟:我們建立了一套為機構客戶提供技術服務的數字化資産配置系統,再由持牌的機構根據這套系統提供大衆使用的智能化的理财産品,目标群體是中産階級,那我們的系統有三個特點,1)交易不頻繁。2)交易政策容量要很大。3)對時間不敏感。是以,我們數字化資産配置系統要解決的問題跟傳統意義上的絕對收益基金是不一樣的,那對應的解決方案也就不一樣。他們是已經有了一套非常完備的交易體系,比如說高頻交易這種技術能力,然後在這個基礎上求得一種方法求得一種解決方案,比如說用機器學習去做高頻交易。

但我們做的系統是為廣大中産階級所用,是以不會太過依賴于絕對收益 α,但像文藝複興西蒙斯所說,任何 α 政策的交易其實都處在一個非常短暫的區間。是以對于我們要解決的問題,他們這種方法肯定不适合。那我們就回歸到金融邏輯上去解決這個問題,基于資産配置理論。該理論是馬科維茨在 1952 年提出的,後續又有許多人對這個模型做了改進和加深。它最大的好處就是風險分散,是以特别适合家庭理财,能夠根據你的風險承受能力給你求得一個風險收益的最優比。

這樣的話,你就永遠不會出現像以前 LTCM(美國倒閉的長期資産管理公司)出現的問題,一旦錯了就萬劫不複,這是任何一個普通家庭都沒有辦法承受的。對我們來說,要為中産家庭解決一套解決方案,最佳模型就是用馬科維茨這套方式,進行風險和收益最優的一個測算。使得使用者在長期的一個過程當中,他能夠得到一個穩健和長期的收益。在這個理論基礎,我們了一些變化和改進,比如說解決均值回歸周期很長的問題,我們會通過數理統計和機器學習的方法在這個方面加以一些改進,這也就是我們和今天市面上其他模型不一樣的地方。

最近一段時間,智能投顧這個說法在中國有被濫用的趨勢,很多公司都聲稱在開發智能投顧系統。但我要提醒的是,國際上通行的 Robo advisor 概念和國内近期的智能投顧概念有很大不同。國際上的 Robo advisor 是指以馬科維茨的資産配置理論為基礎,以經濟學上嚴格定義的大類資産為投資标的,以 ETF 為投資工具,運用量化的方法和計算機技術,幫助使用者自動配置資産,并進行動态再平衡的系統。這套系統追求的是貝塔收益,長期的穩健的收益。

而我們在國内看到的很多所謂的智能投顧,根本跟這個理念是背道而馳的,他們追求的是短期絕對回報,投資标的千奇百怪,甚至包括了大量的非标資産,并有資金池嫌疑。此外,在國内的語境下,「投顧」有特殊含義,很多情況下是指給客戶提供個股投資建議的顧問,需要有證監會發放的牌照。

是以我們認為國内的「智能投顧」并不能跟國外的 Robo advisor 劃等号,這也是為什麼我們把自己的系統稱之為「數字化資産配置」。我們公司隻為機構客戶服務,為他們提供整套數字化資産配置的解決方案,再由這些持牌的機構為個人使用者提供合規的産品。

這也是我們跟市面上絕大多數公司不同的方面。個人使用者很難判斷一套系統的技術實力高低,更容易被市場營銷所影響,而機構使用者則相對專業的多。

機器之心:智能理财首先需要的是資料,我們用到的資料主要是哪些?在擷取資料過程中是否也存在資料拿不到或拿不全的問題?    

鄭毓棟:我們目前的數字化資産配置系統用到的資料主要三方面,首先是所有大類資産在一個市場環境下的資料,以及和它底層産品的資料。我們回溯了接近十五到二十年的價格和走勢。其次是各種反映經濟基本面的全球宏觀資料,它們作為很重要的因子來影響資産面價格。第三是使用者資料,随着使用者對我們産品的持續使用,我們會收集越來越多的使用者資料,這主要是用來進行使用者畫像,比如判斷使用者的風險承受能力。

資料拿不到,或者資料不全,也是是一個問題。首先,所有公開的資料我們盡量收全。比如國家統計局公布的經濟資料,其實都很全的,我們可以盡量拿來。第二,自己本身這套系統也很重要,是指本身交易系統提供的資料和客戶本身的交易資料,如果慢慢積累的話,也會有一定的解釋性。隻要樣本足夠大,雖然拿不到全資料,但拿到足夠的樣本資料也是可以解釋的。

機器之心:在收集資料時,除了類似于像失業率之類的傳統資料,會不會把一些事件進行量化加到模型裡,比如金融分析工具 Kensho 的搜尋引擎會自動将發生的事件根據抽象特征進行分類。你有沒有考慮過這方面?

鄭毓棟:這是件很有意思的事情,這個對資料的不連續性要求更高了,噪音是也更廣了,我們這塊還在研究,還處在實驗階段。我覺得這個方向是對的,因為行為金融學是比較普遍的存在于市場上的。我們為了求得最小誤差要解決過度拟合的問題。因為你需要采取的資料更廣,那問題的複雜度上升了好幾個量級。跟我們拿一些經濟資料和基本資料來做完全不可同日而語,這個東西有太多未知的可能。但終歸我覺得它是一個正确的研究方向。

機器之心:璇玑的智能理财産品在哪些地方用到了人工智能和機器學習等相關技術?

鄭毓棟:具體來說,我們的數字化資産配置系統主要是預測某一大類資産在未來的波動,它可能是向上、向下或者平坦,是以這就成了一個非常典型的機器學習問題。當我有一個均值回歸的基礎值,有了一套外面大的基本面資料時,怎麼來有效地做一個判斷,它的這個值是一個向上還是向下的趨勢。那我們的做法是在這個程度上機器學習還是起着一種輔助作用,而均值回歸是一個基礎。我們假設一個人拿着繩子牽着一條狗,人作為價值,而狗是價格,狗可以跑來跑去,但是它要一直圍繞着人。是以在均值回歸這種情況下,一個基礎的考量是我們需要判斷繩子的長度和繩子在前在後在左在右,再做一個小規模糾錯。這樣保證的是什麼呢?我們不會出現賭博的情況,整個模型的一個大基礎是我不賭博,我一定要進行風險分散。機器學習發揮的作用是可以去訓練它,去獲得經濟變量對于大資産的變化跟走勢。

值得注意的是,我們不是依賴機器學習模型這一種方法,而是要采用多模型的方式,除了支援向量機(SVM)這樣的模型,還要利用傳統的資料統計方法,包括事件訓練模型、回歸模型等。我們将這些方法綜合起來給一個評分,對資料做完分類之後做預測,經過實證研究之後再拿給客戶。

對這幾種模式進行混合,同時對它的上下限進行一個有效的風險控制,以防止整個預測是錯誤的。機器學習其實在金融學上還有一些風險存在,最大的風險就是過度拟合的一個問題。馮•諾依曼說過一個很有意思的話,用四個變量我就能夠拟合出一頭大象,而用五個參數我可以讓它的鼻子擺動。這說明從拟合的角度看,如果你給我足夠多的變量,我是能夠解釋一切的,但這是否符合金融自身的邏輯,還存在疑問。是以,我們會選擇支援向量機的原因在于它是一個已知證明的理論,我不需要非常精确漲跌多少,我需要的是一個分類和信号,上、下或者是平的信号,這是一種模糊的精确。其次,我可以把一些有效的變量投射到高維,這樣就把非線性的問題變成了一個線性問題,然後去求解。是以,我覺得對金融問題來說,這樣一種模式可能是比較有效的機器學習應用方法。

機器之心:根據以往測試,這套系統的表現如何?

鄭毓棟:我們的産品中,風險和收益是相比對的,最積極的組合大約有 17% 的年化回報,波動率大概在 15% 左右。最保守的組合的波動接近于 0 ,年化回報在 6%-7%。我們應該是比較好的把馬科維茨的模式解釋了出來,你追求越高的回報,就要承擔越高的風險。我們大概有一個标準,六級的風險模型。我們看到每一個模型的收益和長期回報都是不斷上升的,波動也是在往上走的,然後讓客戶自己選擇。我們還做了資料可視化方面的工作,因為很多人看不懂波動這種統計學上面的東西,是以我們會把十年最大回撤這類數字展示給他看。最積極組合十年的最大回撤大概在 15%-16%,在金融海嘯時到現在,最保守那個組合的最大回撤是 0.7%,是以幾乎是直線,這個很明顯地讓大家看出,你願意付出什麼樣的代價,就得到什麼樣的回報。

機器之心:璇玑的數字化資産配置系統的模型與那些做量化交易的模型主要有哪些差別?

鄭毓棟:我們這個是相對透明的一種,因為很多量化的東西其實是很黑箱的,交易的是什麼你不知道,交易的邏輯你也不知道,但我們這個相對來說比較簡單,因為我們的基礎是馬科維茨,非常公開透明。我們其他任何改進都是基于馬科維茨的一個補充。

首先,量化交易追求的是絕對收益 α,因為這種交易機會轉瞬即逝,是以公司不會把模型公布出來。我們不做任何形式的套利,是以也不怕别人來套利。我們的初衷是想做一個符合廣大中産投資人的一個資産配置的模型。其次,其他政策在達到一定程度會面臨容量的問題,最大的政策,我覺得上億也就了不起了,很少有過十億、百億交易政策的容量,唯一有這麼大容量的交易政策就是追求 β 的這種資産配置。是以這也是為什麼我們覺得這塊的一個潛力是非常大的,因為這個模型出來以後,就是千千萬萬的人都能用。

人工智能在金融領域的應用和影響

整個金融是由一連串的資訊構成,怎麼将這些不連續的資訊,甚至是有噪音的資訊進行過濾、整理、辨識、分類,然後傳遞給使用者,科技金融在這方面很有潛力。

機器之心:你對于人工智能應用于金融業如何看待?

鄭毓棟:人工智能在金融領域的應用其實是一個很大的問題,一直也是業界所關注的,金融适不适合使用機器學習?到底什麼樣的問題适合用機器學習來解決?我們的看法是,在應用機器學習之前,要首先有個大的金融邏輯,有自己對金融理論的思考。目前業界有種做法是資料說話,把資料扔進去,我未必能解釋這個資料展現的是哪種金融理論和邏輯,然後用輸出的結果去預測。我們不是特别贊同這派,因為資料有很多偶然性,金融市場跟下棋不一樣,下棋是一個規則清晰、資訊完備、博弈雙方很明确的行為,是以會得出一個沒有噪音的結果。而金融市場充滿噪音,博弈雙方有特别多的偶然性。因為我們都是金融背景出身,而非統計和工程背景,是以在這方面會有一些基本的想法——進來的資料、使用的模型和方法要符合金融本身的邏輯,這樣才能談的上是建構一個有效的模型。是以,機器學習是一個方法,怎麼用取決于你的模型。

馬科維茨的傳統理論被證明是一個确實有效的方式。你不能說加了機器學習,反而使它的理論變得不有效,這是不對的,是以我們在這方面做了很多大量的測試和工作。我們是運用機器學習,但還是認為應該以金融理論為主,将機器學習作為一種支援。

機器之心:現在有很多公司會利用人工智能技術去預測股價,你對于這個方向有何看法?

鄭毓棟:這方面的學術文章一直沒有斷過,都是用這個人工智能預測股價,這個是最多的。為什麼這些學術成果到現在都沒有運用?其實我覺得最大一個問題就是,很多機器學習專家并不是金融出身,他發現了一種資料模型或者學術方法,但沒有想到怎麼運用到金融領域。而且股價相關資訊的噪音是最多的,僅僅拿着過往的走勢預測未來是對的。這麼多年來,沒有出現一個有效的可以預測股價的方法,這個問題是否是機器學習完全能夠解決的?這是值得大家思考的。

今天有很多工程、統計方向的人,覺得人工智能在金融上很有應用,紛紛往這個方向轉,希望求得金融的靈丹妙藥,我覺得在這個方向上還是要非常注意的。就像我之前所說,一旦賭錯方向就是萬劫不複。

我們在這方面還是非常謹慎的,用多模型、多政策,包括傳統的統計學和機器學習來作為應用,對它的上下限做了嚴格的規定和控制。而且我們所使用的大類的基本面資料,比如說M2、CPI、失業率、房價、PMI等,用這些指數進行大類資産的預測是可以被解釋的。我們認為比較靠譜的方式去做機器學習。我們用了大概四五年的資料去做訓練,接下來再學習十幾年,并且在它上面加了非常嚴格的糾偏和糾錯機制,不讓它每次做太多博弈。這是在做風險控制,是以還是比較可信的。

機器之心:Kensho 創始人 Daniel Nadler 說,「我們正在以破壞大量相對高薪工作為代價來創造極少數的更高薪工作。」你認為人工智能技術在金融領域的應用将如何影響從業人員?

鄭毓棟:其實這個很有意思,你看美國市場,金融市場發展了這麼多年,越來越有效。大家就發現美國基金經理主動管理的超額收益幾乎為零,跑赢大盤的人很少。整個公募基金業在美國有越來越萎縮的感覺,在這種情況下,我們看到像Vanguard Group這樣的公司,發展的反而很好。它是全球僅次于貝萊德的第二大被動投資基金,多年來以做ETF為主,秉承的理念就是基金經理最終的主動管理能力是收斂的,無法提供超額回報,是以我做ETF就好。而國内還在談明星基金經理,好像找到一種點金術似的。是以我覺得,第一,點金的人肯定是很少,點金的模型也是很少的。因為整個市場越來越有效的時候,隻有最厲害的人或者交易程式才能捕捉到α。第二,當α變得越來越少的,你就不需要這麼多人在市場上研究政策。是以你上面提到的那個趨勢,我是相信的。

機器之心:除了智能理财,機器學習等人工智能還将應用于哪些金融領域?

鄭毓棟:首先,信貸是一個很大的應用領域,會是機器學習大放異彩的地方。它可以對人群進行很好的劃分和分類判斷,什麼樣的人可能不違約,什麼樣的人可能違約,什麼樣的人違約率高,等等。機器通過反複訓練是可以給我們以指導的。我覺得信貸領域是大資料能夠解決的一個問題。其次,在反洗錢等金融安全方面,機器學習也能有很好的應用。它跟篩選垃圾郵件很像,我判斷這是不是一筆有洗錢嫌疑的資金交易,今天是用人工通過一些固定規則把它抓出來,但是這個規則也許本身是可變的。使用機器學習,你把大量資訊輸送給它,它就可以自動抓到。金融安全現在在全球銀行的交易成本也越來越高,因為所有的監管都對這快看的非常緊。是以在這方面會有很大的發展可能。總值,任何對機率有需求、需要進行分類判斷的都可以用到機器學習。

我們璇玑公司隸屬于 PINTEC 集團,集團旗下還有讀秒智能信貸公司、積木盒子等。不久前我們的讀秒公司公布了一個資料,他們的智能信貸系統一個月要處理 50 萬筆貸款,6 個人做這個事,當這個業務量翻幾倍以後,也隻需要這幾個人。如何是傳統銀行,動辄是成千上萬的信貸員在做這個事情。我們的大資料團隊會幫助信貸做使用者分析和畫像。這就讓信貸業務擺脫了人工的限制,實作了非線性增長。

機器之心:高盛之前一直大規模招聘機器學習人才,也在一次投資者會議上表示,我們不是一家金融公司,而是一家科技公司。另外國内也有很多金融公司表示在越來越多的使用機器學習,你如何看待這種現象?

鄭毓棟:其實科技投入是件好事,尤其是大機構。從robo advisor來說,我們去年很明顯地看到,高盛、貝萊德和富達等大機構都非常深度的進入了這個領域,說明這個領域本身是大家非常關注的一個方向。那從深度學習的角度,它有這麼多的應用,大機構肯定在研發上面對它非常感興趣,這個是可以了解的。我們把自己定義成一家科技金融公司,我們認為,科技金融除了深度學習以外,其實還有很多技術,比如區塊鍊,這是一項非常龐大的研究工程。海外很多東西拿出來是實實在在,背後有很深科技的基礎存在,而且通過了實證,确實幫使用者解決了問題。而國内很多公司跳出來,很多時候還處在一個表面階段。

機器之心:除了人工智能,還有哪些技術在金融領域會有比較長遠的應用?

鄭毓棟:科技金融将對金融行業産生很大推動,這點我是深信不疑的。比如說基于生物資訊的個人身份認證,還有去中心化支付,未來會在很大程度上幫我們節省交易時間和交易成本。還有比如Kensho這類公司,怎樣把金融知識集中化随機的提供給使用者,而不依賴于人工提供給使用者,這也是一個很大的應用場景。最終來說,整個金融是由一連串的資訊構成,怎麼将這些不連續的資訊,甚至是有噪音的資訊,進行過濾、整理、辨識、分類,然後傳遞給使用者,在這方面很有潛力。

公司介紹:

璇玑是PINTEC 旗下的數字化資産配置解決方案提供商, 由财富管理業資深人士、金融工程師、大資料科學家和網際網路科技團隊聯合打造, 以現代資産組合理論為基礎,運用數量化模型、機器學習輔助、雲計算和程式化交易等手段, 為持牌的機構使用者提供個性化、智能化、自動化的一整套數字化資産配置技術解決方案。

PINTEC集團介紹:

PINTEC 是一家智能金融服務集團。我們專注于大資料處理和金融科技研發,為企業和消費者提供最高效的智能金融服務和解決方案,用科技縮短人和金融服務的距離,促進金融服務平等化,讓金融不再高遠冷漠。

PINTEC旗下公司包括:讀秒智能信貸公司,璇玑數字化資産配置公司,積木盒子網貸資訊中介平台,虹點基金銷售公司,麥芬保險經濟公司,企樂彙企業征信平台等。

繼續閱讀