1 月 13 日,在浙江衛視播出的大型科技綜藝節目《智造将來》中,代表支付寶最新研發進展的生物識别系統「310099」首次亮相,并成功完成挑戰:從 500 位蒙面觀衆中找到目标人物。
在這之後,螞蟻金服生物識别技術負責人李亮也向我們全面解讀了這背後的技術能力:支付寶采用了哪些識人技術,除了常見的指紋識别、2D/3D 人臉識别,他們還在研究新型眼紋識别方法,這種方法結合人臉識别能獲得極高的準确率。目前眼紋(鞏膜靜脈)識别隻有少量研究工作,李亮博士向我們詳細介紹了虹膜識别的主要流程。
生物識别
除了常見的指紋識别、人臉識别,生物識别還包含眼紋識别、虹膜識别、聲紋識别和視網膜識别等技術。人體的很多生物資訊都可以用來識别「身份」,基于不同的算法和傳感器,業界正在開發的生物識别技術約有三百種。
目前比較成熟的是人臉、指紋和虹膜識别技術,螞蟻金服生物識别團隊正在研發眼紋識别,即識别眼睛的鞏膜(眼白)的血管排布情況。眼紋和虹膜一樣,都具有很高的唯一性,即便是同卵雙胞胎,眼紋也是不同的。如果我們将眼紋識别技術疊加人臉識别方法,那麼準确率有望再提升幾個數量級,而且使用者還不需要增加額外的操作或配合。
以下介紹了幾種生物識别技術的優缺點:
- 人臉識别:優勢是使用者體驗好,不需要使用者刻意配合;不足是人臉識别可能會受姿态、光照、遮擋、圖檔清晰度等因素影響。此外,對于兩張長相極端相似的臉,人臉識别技術有可能識别不出。
- 指紋識别:指紋應用最廣泛,技術也相對成熟,但應用上有局限性,一是少數人指紋比較差(磨損、受傷等);二是指紋會被複制,存在安全風險;三是在手出汗等特殊情況下,會影響到識别;四是采集指紋需要對象的配合,便捷性差一些
- 虹膜識别:準确度高,唯一性強。不足在于需要使用者主動配合,并且對硬體的要求比較高,需要有虹膜攝像頭。
- 眼紋識别:準确度與唯一性和虹膜識别相當,但對硬體沒有特别要求,普通攝像頭即可。不足在于眼紋識别需要使用者主動配合,使用者與采集裝置之間的距離、光源等(在一些光線下,眼球會反光,進而影響識别)要求都比較高,進而影響使用者體驗。
支付寶從 2014 年開始研究人臉識别技術,李亮介紹了在這幾年研究及落地過程中的幾個重要節點。
2014 年随着移動網際網路時代的全面到來,我們越來越發現傳統以密碼驗證為代表的身份驗證方式和起源于 PC 時代的傳統風控體系已經不适用于移動網際網路時代的使用者随時随地使用的多樣化需求,帶來的後果是,許多場景下使用者的行為和交易容易受到打擾或者被風控系統誤攔截,給使用者帶來了非常不好的體驗。而這一問題背後的本質原因是很多時候我們不了解每一個交易和行為背後的使用者是誰。
是以,支付寶應用人臉識别技術的出發點就是希望首先在身份驗證環節采用更安全更便捷的生物特征認證方式,能夠更準确識别每一個使用者,使得使用者在後續的場景和交易中暢通無阻,也能更進一步享受到更智能更個性化的服務。
從 2015 年開始,支付寶将人臉識别技術相繼應用于風控場景和登入場景,再到 2017 年 9 月将刷臉支付技術全球首次商用并逐漸規模化,在大量應用場景中鋪開「刷臉支付」。2018 年 12 月,螞蟻金服推出「蜻蜓」,一款線下即插即用刷臉支付硬體裝置,使用者不用手機也可以刷臉支付。
這其中尤其引起我們關注的是「安全和隐私保護」、「以人為核心」、「使用者體驗」、「線下硬體」。
從實驗室到商用
從實驗室走向商用靠的絕不僅僅是技術和算法。
在生物識别技術落地的過程中,最大的技術突破是人臉識别,即在圖像特征抽取和人臉比對環節中取得了很大進展。但是,實際場景中的影響因素是很多的。從全鍊路的角度來看,活體檢測、人臉互動、關鍵點定位、人臉跟蹤等在真實的場景下,特别是不同的手機、環境、使用者背景等條件下,想做到非常好并且穩定的使用者體驗是很難的。螞蟻金服生物識别團隊對此進行了很多特殊的優化,如使算法在不同的手機上達到比較一緻的運算速度、響應時間,通過文案設計提高使用者對刷臉的感覺和了解,适應使用者背景(如光線、角度等),分析基于其他傳感器資料的回報等。
技術落地的過程中會遇到各種問題,支付寶生物識别技術負責人李亮介紹了一件有趣的事。晚上和周末,刷臉的用戶端通過率會明顯降低,使用者調研後發現,第一版的活體檢測是請使用者對着攝像頭點點頭,但很多人那時已經躺在床上,沒法點頭,而實驗室或者工程師自己測試時是不會想到躺着做測試的……
算法在某些情況下存在局限,是以就需要從産品互動、從工程優化等其他角度來解決此類問題。也就是說,算法的高準确率需要滿足一定前提條件。而技術的真正落地則意味着要解決這類碎片化、個性化的細節問題,使産品能夠真正得到普及。目前幾乎所有 AI 算法都面臨這個問題,即在垂直領域上能夠很好地解決問題,但通用的泛化能力不足。這也是為什麼現在大家都不再讨論算法名額,而是更關心實際場景落地的表現。
生物識别的一個重要問題是活體檢測,即判斷采集到的人臉是否來自于真人。螞蟻金服生物識别技術活體檢測采用了多因子身份認證技術,為核驗身份提供更多的依據,不僅能提升識别的準确率,還能進一步提升安全性。
出于對使用者體驗的堅持和幾乎無門檻使用的考慮,螞蟻金服在活體檢測技術的研發過程中一直堅持靜默活體檢測,即使用者無需進行過多的動作或互動(如轉頭、張嘴等)。李亮介紹道,螞蟻金服生物識别技術在靜默活體檢測中最多可能讓使用者眨一下眼,主要是通過多個次元,包括多模态的眼紋和運動分析、其他傳感器資料,以及風控體系中和使用者相關的行為等來綜合判斷是否來自活體。
實踐中的安全保障
從模型走向安全的産品靠的是融合更多保障技術和算法。
生物特征具備「唯一性」和「終身不變性」等優點,但生物特征同時也存在「不可撤銷性」的特性,人臉圖像的隐私保護和模闆安全是個重要研究課題,一方面我們研發了基于單向變換的圖像脫敏技術,對上傳的人臉圖像進行脫敏和加密處理,使得處理後的資料無法複原到原始圖像,同時還能保持資料的可區分性和可學習性。另一方面,生物秘鑰生成技術和加密空間共享學習技術也是目前的研究重點,在滿足生物特征識别能力的同時,滿足生物特征模闆單向變換和可撤銷等要求,實作對使用者的隐私保護和分布式資料的安全使用。
同樣指紋和眼紋等識别算法也非常關注安全性,例如眼紋識别中有個很關鍵的技術就是眼紋模闆的隐私保護。它在注冊新眼紋并生成模闆的過程中會同時産生很多雜亂點,并通過密碼學的方法将眼紋關鍵點隐藏在這些雜亂點中,使得最後生成的模闆無法單獨恢複出原始的眼紋特征點,進而實作生物特征模闆保護的目的。
前沿的多模态識别
既然有這麼多的生物識别技術,而且還能實作大規模應用,那麼我們怎樣才能利用它們整體上的優勢呢?答案就是聯合多種生物特征的多模态識别。因為即使兩項隻有 80% 準确率的識别方法,它們聯合起來也能達到 96% 的準确率。這也就是為什麼支付寶結合 2D 人臉、傳感器資料、運動分析、3D 人臉成像和眼紋等特征,進而打造更安全的多模态識别技術。在這一部分中,我們主要讨論了 3D 人臉和眼紋等前沿方法如何加強多模态識别的準确度。
3D 人臉識别由于擷取了第三維的深度資訊而能有效防禦照片和面具等攻擊手段,螞蟻金服生物識别技術也包含了高效的 3D 人臉識别算法。因為 3D 相對 2D 的人臉識别多了深度資訊,是以衆多的 2D 人臉識别訓練集并不能直接使用。李亮表示螞蟻金服最開始研發 3D 人臉識别技術也是基于公開資料集,但目前有很多方法可以生成或預測平面圖像的 3D 資訊,例如利用多張平面人臉重建三維人臉點雲或者直接使用 3D 渲染軟體重構圖像。
此外,3D 點雲這種資料結構是無法直接使用卷積等深度學習方法的,是以螞蟻金服主要根據點雲的立體特征進行處理。在面對這種資料結構時,我們可能很自然地想到将深度資訊作為 RGB 後的第四個通道 D,并将第一層卷積核的深度調整為 4 而直接運用深度卷積神經網絡。但李亮說:「這在理論上是可行的,但是對資料品質有更高的要求,我們目前也在做大量的嘗試,隻不過還沒有獲得比較好的效果。」本質上 3D 人臉是多因子人臉識别中的一個因子,它與眼紋識别等方法一樣有助于提供更安全的識别方案。
盡管 3D 人臉識别能對傳統 2D 人臉識别有很大的增強,但它也有一些局限性,比如對深度圖的資料精度和完整性有比較高的要求,而目前 3D 成像所依賴的結構光技術主要使用近紅外散斑雷射獲得深度資訊,近紅外的某些波段在戶外強光下是有可能失效的,李亮表示這确實是目前 3D 成像面臨的一個技術難題。
盡管 3D 資訊能有效提升識别準确率,但多模态生物識别技術希望加入更多新的模态生物因子,進而在不增加額外使用負擔下增強刷臉的安全性。是以如果我們在人臉識别的過程中加上眼紋等資訊,那麼在不改變使用者體驗的情況下能實作更高的安全性和更強的防攻擊效果。目前眼紋識别方面的研究與工作都比較少,因為相比人臉識别,眼紋識别需要品質和分辨率更高的圖檔,處理的方法也更複雜。不過螞蟻金服在這方面已經做了很多研究,借助眼紋資訊,長相極度相似的同卵多胞胎也可被正确識别出來。
眼紋一般指的是眼白(鞏膜)部分,而眼紋識别主要是區分眼白的血管分布情況,借此确定人的身份。是以眼紋識别對攝像頭也有一定要求,隻有高品質圖像才能擷取靜脈的細微特征,并完成後續的識别過程。
與人臉識别相同,眼紋識别技術主要可以分為采集和比對兩部分。其中采集主要是從「活體」人臉圖像中對眼部區域着重分析,包括眼睛的眼白部分和眼周部分,并作一定的圖像預處理和增強;而比對則主要是在眼紋特征點下對比兩個眼紋之間的特征相似度。
支付寶生物識别技術負責人李亮表示,所有生物識别技術的使用都分為注冊流程和認證流程。注冊流程首先會采集多張眼紋并在此基礎上做後續的資料增強和特征提取,圖像增強會強化眼部細微特征的明顯性,進而在保證眼紋圖像清晰的情況下才能提取足夠的眼紋特征。
關于眼紋注冊流程中比較重要的特征提取步驟,李亮說:「提取眼部區域中的微細特征作為感興趣點,這些和指紋興趣點的提取有點類似,并且具有很好的時間不變性和個體差異性。除了眼白,眼周也會提取一些興趣點。」最後,模型為這些興趣點增加隐私保護就能生成注冊流程最終的眼紋模闆。
一般同一個人眼紋特征有非常多對應的地方,而不同人的眼紋特征極少有對應的地方,是以隻需要設定一個合理的門檻值就能根據眼紋識别不同的人。此外,目前眼紋識别的難點還在于前面的分割、增強和特征提取算法,這方面還有很多工作需要不斷優化。
在支付寶看來,盡管多模态識别已經結合了很多前沿技術,但眼紋等仍需要更多的研究與實驗才能真正支撐起下一代識别應用。
本文為機器之心原創,轉載請聯系本公衆号獲得授權。