天天看點

IBM PowerAI程式設計大賽Q2場來襲!探秘金融語料大資料識别

由CSDN主辦,IBM和興業數金協辦的PowerAI人工智能線下馬拉松程式設計大賽Q2場将拉開序幕。本賽季賽題将聚焦金融行業的語料大資料識别,基于人工智能相關技術,計算有關金融場景的資訊聚類,将電話銀行海量通話内容結構化,并打上各類标簽。通過挖掘分析有價值資訊,為服務與營銷提供資料與決策支援,發現最新的市場機遇和客戶關注熱點。活動旨在進一步推動人工智能技術在行業領域的落地,貼近生活并與真實案例場景,也是系列賽題内容的一大特色。

IBM PowerAI程式設計大賽Q2場來襲!探秘金融語料大資料識别

截止目前,本輪活動已收到了大量參賽者報名,絕大部分參賽團隊成員來自金融機構和相關的技術服務公司,例如招商銀行上海分行、民生銀行、包商銀行、華通銀行、陸金所、太平洋保險、華為、東方證券研究所、上海金融期貨資訊技術有限公司、中國大地保險、國泰基金、西藏東方财富證券、東軟集團、實達電腦等,也有一些一線網際網路公司和頂尖的科研院所報名,例如今日頭條、京東、中科院上海所、上海交大、中國科學技術大學等。

從本季題目内容來看,主辦方會提供訓練樣本資料,分為訓練和測試部分。訓練部分包括: 

- 對話内容檔案(檔案格式可能存在轉碼需求),對話内容分為11類 

- 對話内容标簽檔案,包括理财産品分類和意願分類(肯定、否定、疑問) 

- 語料檔案-檔案格式為txt格式。内容包括中文和标點符号。文章内容是金融相關的文章。檔案總量在50M左右。參賽團隊可以利用這些檔案來建立自己的語言模型、分詞模型 

- 訓練資料:每個分類的樣本個數不少于150條。資料樣本間有一定區分度。

參賽者需要根據訓練檔案進行購買産品分類和意願分類;大賽鼓勵參賽選手自己建構分詞和語言模型,如果選手選擇使用第三方分詞或者語言模型需要自己解決平台依賴。

在參賽要求方面,主辦方也給出了一些建議: 

1.參賽者可以通過Caffe、Tensorflow、Torch 、Theano 進行模型訓練, 鼓勵發揮GPU on Power硬體特性;

2.要求參賽者編寫神經網絡模型實作考題需求。參賽者可以修改Caffe、Torch、Theano或者Tensorflow源代碼,但是必須在修改後,提供代碼修改說明以确定沒有違規部分。參賽者也可以使用Github上開源的不同發行版的Caffe、Torch、Theano或者Tensorflow,但是必須自己解決在Power上的依賴和編譯問題;

3.本次比賽涉及金融領域對話文本分類問題。希望選手通過深度神經網絡能夠對客戶感興趣購買的保險或者理财産品的類型和意願進行分類。語料中會有“肯定”,“疑問”,“否定或者雙重否定”語句。傳統的詞頻或者簡單的SVD方式很難在測試資料集中有良好的表現;

4.本次比賽涉及金融領域對話文本分類問題。希望選手通過深度神經網絡能夠對客戶感興趣購買的保險或者理财産品的類型和意願進行分類。語料中會有“肯定”,“疑問”,“否定或者雙重否定”語句。傳統的詞頻或者簡單的SVD方式很難在測試資料集中有良好的表現;

大賽開戰在即,CSDN也對某位報名參賽的開發者進行了簡短采訪,他就目前人工智能技術在金融行業的應用現狀和挑戰等話題分享了自己的看法。以下為采訪内容(受訪者不便透露真實姓名,以李成代替):

1.CSDN:請先介紹下自己所從事的工作和參賽原因。 

李成:目前本人在金融行業軟體公司工作,主要負責銀行、證券行業的資訊開發服務。這次主要是想檢驗自己在項目中用到的技術,也想結識更多在金融行業從事人工智能技術研究的開發者,互相切磋。

2.CSDN:請談談您對人工智能技術在金融行業應用現狀的看法。 

李成:随着金融資訊化的不斷深入,銀行正在從過去的手工銀行轉變成數字化銀行,極大的推動了全球金融的發展。由于雲計算、大資料、人工智能等技術在金融行業的不斷普及,更多的銀行都在思考如何通過這些新技術提供客戶粘合度,為客戶提供全生命周期的服務,提高服務品質,以及從所積累的海量使用者資料中挖掘新的商機。目前,我們看到人工智能技術已經在金融領域的授信、反欺詐、風控、審批、差異化服務等多方面落地。

3.CSDN:從您的介紹看有從事人工智能應用項目的經曆,請談談當時所希望解決的問題。 

李成:主要有幾個方面:1.通過人像識别技術在銀行監控範圍内識别客戶的各種行為特征,例如身份認證、人臉刷卡,或者其他安全識别等;2.通過語音識别判斷客戶目前的狀态和特征;3.可以通過人像、語音識别縮短業務流程;4.通過呼叫中心平台識别客戶具體語音,如客戶說出某關鍵詞以後自動處理下一步業務等。

結合我現在正在做的項目,具體來說,目前銀行信用卡中心的業務都是通過電話進行,我們希望利用語音識别技術,對通話進行實時分析,幫助銀行提升服務的品質。還有就是利用機器學習,可以讓機器人回答客戶的提問和互動。

4.CSDN:您認為現階段,在金融行業什麼樣的應用場景是比較适合用機器學習或人工智能技術來解決的? 

李成:不管是在提升客戶體驗還是内部管理效率,商機挖掘以及風險防範方面,人工智能在金融行業的應用前景都非常廣泛。結合我的經曆,我認為銀行行用卡中心應該是一個很好的驗證場景。人工智能,目前語音方面技術是最成熟的,而銀行信用卡中心,基本全部的業務都是通過電話進行,技術應用潛力非常大。

5.CSDN:您之前是否了解過IBM的産品或解決方案?從您的角度看,IBM在人工智能領域的機會主要在哪些方面? 

李成:了解過。IBM的機會在于不僅在技術上持續投入很大,而且對于金融行業的業務、流程都很熟悉。在這個金融行業向數字化轉型的風口,隻要切準使用者痛點,技術精深+業務流程熟悉,就能找到很多機會。

6.CSDN:對本次大賽有什麼期望,對參賽夥伴有什麼寄語? 

李成:我相信這次的選手中大拿很多,我自己在金融行業和人工智能也有一些實踐經曆和積累,希望大家能獲得優異的成績。另外,希望通過AI技術能夠真正幫助金融機構提升他們的業務。

據悉,本次所有的參賽團隊,都将現場免費體驗所有參賽團隊,将現場免費體驗IBM專門為人工智能所建的高性能計算伺服器PowerAI。PowerAI人工智能平台基于Power8體系結構,支援開源機器學習和深度學習架構,包括Caffe, Chainer、TensorFlow、Theano、Torch、cuDNN、NVIDIA DIGITS以及其它若幹個機器學習與深度學習架構和庫。參賽者将輕松便捷地使用這些人工智能方法,建立新的計算機模式以高效的對資料進行分析。

最後,一如既往,主辦方為獲勝團隊和參賽者準備了豐厚的現金和獎品獎勵,歡迎大家6月17日來玩!

本文出處:暢享網

本文來自雲栖社群合作夥伴暢享網,了解相關資訊可以關注vsharing.com網站。

繼續閱讀