如果網絡是一個戰場，人工智能如何幫助我們建立安全防線

本月，天池和阿裡雲安全合作舉辦的第二屆阿裡雲安全算法挑戰賽落下帷幕，近2000名安全算法人的正義夢想，也從這裡剛剛起航。

在網絡為中心的世界中，人工智能和機器學習的技術，開始與“威脅論”挂上了鈎。但技術本無善惡，往往取決于使用技術的人。

在網絡安全領域中，我們用人工智能和機器學習，來更精準地檢測或防禦網絡攻擊，不管它是一次惡意的系統入侵，一次虛假的賬号登入，還是對你重要密碼的強行破解。人工智能戰隊，配合安全專家，讓安全的黑暗死角被照亮。

今天的話筒，安全君交給DT财經的DT君，讓他帶你看看，安全算法挑戰賽的頂尖戰隊，是如何用機器來保護人的？

當網絡安全加上了“雲”，黑客們就怕了麼？

《讓子彈飛》裡，葛優在火車上吃着火鍋，唱着歌，突然就被姜文的一夥土匪搶劫了，于是賠了夫人又折兵。這是一個世紀前的“安全問題”。

一個世紀後，你在家裡吃着火鍋唱着歌，被“搶”的不再是你本人，而是你的手機、企業網站和資源資訊庫。土匪變成“黑客”，他們用技術手段盜取你的資料資訊，劃走你銀行賬戶的存款、擊潰你門戶網站的流量，薅走你苦心經營的“羊毛”。

據阿裡雲資深算法專家施亮介紹，如今中國的網際網路灰黑産業已經達到了千億元的規模，它們利用網際網路安全的漏洞，不斷從中國高速發展的網際網路産業中掘取巨額非法利潤。

對于一般企業來說，面對來無影去無蹤的黑客攻擊，保護資料安全成本高效果慢。是以，越來越多的企業和個人為了應對風險，将自己的資料和服務放置在雲端，委托給雲服務商進行管理。當網絡安全更新到雲上，對“黑帽子”們最大的影響是，技術和裝置門檻都大大提高了，因為雲服務商為企業增加了一層“防護網”。

這就好比，DT君有一個小商鋪，但競争對手雇傭了一批流氓惡霸扮作普通顧客，賴在我的商鋪門口隻閑逛、不消費，阻礙正常客戶上門。作為個體戶，DT君無法有效識别、驅趕這些“人群”，于是選擇把店鋪開設在某個規範化管理的園區内，讓園區提供高效、精準的安保服務，驅趕這些“惡意人群”。

DT君的小商鋪就是每天都在營運的海量網站，這些流氓惡霸們的行為就是“黑客攻擊”，而整個大園區就是雲服務商。（DT君注：這種用大流量攻擊目标系統網絡服務，緻使系統無法提供正常服務的黑客行為也被稱作分布式拒絕服務攻擊，簡稱DDoS攻擊，是最常見的黑客行為之一。）

目前，阿裡雲承載了中國40%的網站服務，這些資料蘊含了海量的潛在價值。“我們每天防禦的黑客攻擊體量為16億次，包括2億次暴力破解。每天能夠成功防禦2000次DDoS攻擊。”阿裡雲雲計算安全事業部資深總經理肖力告訴DT君，這些大量的攻擊行為，一方面說明了雲安全的重要性和巨大價值；另一方面，也為雲安全的“智能化”提供了豐富的資料“學習”基礎。

（圖檔說明：第二屆阿裡雲安全算法挑戰賽“當最強算法遇上Hacker”決賽現場）

毫無疑問，智能安全是趨勢，但技術和人才都是“稀缺産品”。正是以，阿裡雲的天池平台和安全團隊才聯合舉辦了“阿裡雲安全算法挑戰賽”。舉辦的第二個年頭，已經有近2000名來自各行各業的選手參加了比賽，最終十支隊伍進入決賽，來到杭州與“黑客們”一較高下。

有危險？算法比你更早察覺

本屆算法大賽的參賽題目均源自阿裡雲安全部門平常接觸到的真實業務場景。題目一共有三道：掃描爆破攔截；網頁風險分類；HTTP Flood檢測（7層CC攻擊檢測）攻擊。它們分别對應了三種最常見的網絡攻擊模式：暴力破解密碼黑來盜竊資料，傳播黃賭毒等違規内容，還有發起異常大流量攻擊導緻伺服器崩潰。

比賽可以說是一場實打實的“網絡攻防戰”了。三道試題，其實核心的關鍵就是分類——如何從真真假假的網絡資訊中識别出真實的黑客行為。

在決賽的答辯現場，來自北京郵電大學的buptyellow團隊率先登台就給評委留下了深刻的印象。三位小夥伴熟練地運用了GBDT、RF等機器學習的相關算法，針對各個賽題不同的特點，有針對性地将算法規則建構與特征選擇結合起來，做出了條理清晰、效果較好的雲安全算法模型。

（圖檔說明：buptyellow團隊在決賽答辯現場像評委展示自己的算法過程）

最令人意外的是，三位同學其實都是不折不扣的“斜杠青年”（擁有多重職業、身份多元化人群）。他們本身還是學生，在本次天池大賽前，其實都是機器學習和網絡安全領域的“小白”。

“我覺得他們的解決方案成熟得像一支科班出身的安全算法團隊”，評委之一、思睿家得創始人董靖在評價buptyellow時說到。不過他們隻是參賽隊伍的冰山一角，這樣高水準的玩家，決賽中還有另外九個。

除了組隊參賽的，決賽隊伍中還不乏多位“單刀赴會”的大牛，“鐵球”吳凡優就是其中之一。在第一道題目中，他迅速地利用特征工程的方法對資料進行分類，同時添加黑名單輔助決策，取得了較好的篩選效果。

（圖檔說明： “鐵球”吳凡優在決賽答辯現場展示算法過程）

在解決第二個網頁分類問題時，由于原始資料結構複雜、不規則，極大地增加了他使用機器學習算法的難度。但在對網頁資料進行預處理後，他綜合使用TF-IDF、TextRank 等文本資料挖掘的算法，建構了一套智能模型，最終較有效地從海量資料中甄别出違規網頁内容。

“其實，我們面對的網絡安全問題雖然多種多樣，但是大部分是可以讓安全工程師人眼找出規律的。但是在雲平台上，面對海量的攻擊，人眼是無法看得完的，這必須借助算法和人工智能的力量。”廣東工業大學教授劉文印認為，這次安全算法大賽，比拼的重點并不在于高精尖的黑客對抗，而是如何用有效的人工智能算法，提升現階段雲安全的效率和精度。

（圖檔說明：廣東工業大學計算機學院教授劉文印現場點評選手答辯）

相較于過去通過安全工程師發現并識别攻擊，如今一些智能安全算法已經把這個過程的用時，從半小時縮減到幾秒。

最終，來自北京郵電大學的buptyellow團隊憑借出色的表現獲得了第二屆阿裡雲安全算法大賽的冠軍。

AI可能是網絡安全的新突破點

“凡是應用資料的領域，都存在資料安全的問題。” 肖力認為，“安全智能”是一個十分有潛力的廣闊市場。

“過去大家都是賣産品的，現在随着移動網際網路的普及，越來越多的商家和企業開始向服務層面轉型。例如房地産公司，它也開始做APP，向客戶出售自己的房産配套服務等，這都是基于資料才能完成的”。肖力告訴DT君，未來整個安全的趨勢發展，一定是往資料化和智能化方向靠攏。

（圖檔說明：阿裡雲雲計算安全事業部資深總監肖力與參賽選手分享“安全智能”話題）

雖然現在有很多公司用深度學習、機器學習等技術從事網際網路安全領域的研究，但是真正帶來根本性變革的臨界點還尚未來到。如今安全智能産業仍處于一個不斷優化，提升效率的階段。另外，由于黑客的行為本身具有“黑箱”的特點，即人類黑客一般不會遵循什麼規則的算法和步驟來進行活動，這些“創造性”的行為是很難用數學模型加以描述概括的。這其實加大了安全智能在實戰中應用的難度。

魔高一尺，道高一丈。在現有的情況下，阿裡雲資深算法專家施亮認為，現階段安全智能的目标是通過AI的手段降低安全防禦的成本，同時提升黑客攻擊行為的成本，進而讓黑灰産業“無利可圖”，從源頭防禦黑客的網絡攻擊。

“在使用防護之前，由于技術門檻低，黑客擷取一個訂單的成本隻有一兩毛錢，很容易，但是有了安全智能防護後，成本已經上升到十幾二十塊一個訂單，黑客的獲利成本已經非常高了，讓他們沒有動機去做這個事情。”

（圖檔說明：阿裡雲資深算法專家施亮在答辯現場）

據施亮介紹，如今每年國内的安全人才缺口在10萬數量級。其中從事安全事業、又掌握機器學習算法武器的人才，更是少之又少。這也是為什麼阿裡雲每年都要舉辦安全算法大賽，他們希望從行業和高校中，尋找更多“跨界”的參賽隊伍，尋找來自算法或者安全領域的高手。

DT君認為，雖然現在距離安全智能的奇點還為時尚早，不過未來當越來越多的網絡服務都部署在雲端後，安全一定需要更多人工智能參與。“每個機器大腦背後的智慧，才是推動雲安全前進的關鍵。”

最新一期的《紐約客》中描繪了機器人正在不斷代替人類工作的情形；前兩天，Alpha Zero的橫空出世更讓大家開始擔憂：難道人工智能真的要取代人類了？DT君覺得，AI的出現從來不是為了取代人類，而是幫助人類更加高效、安全。就像網絡安全，AI正在和人類一起，保護你未來每天的“雲端生活”。

原文釋出時間為：2017-10-31

本文作者：程一祥

如果網絡是一個戰場，人工智能如何幫助我們建立安全防線

繼續閱讀

開源低帶寬語音編解碼器

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希