在之前的兩篇文章 基于資料分類分級和敏感資料保護,保障企業資料安全 、 如何基于Dataphin實作敏感資料保護(以消費者隐私保護為例)
中,我們詳細的介紹了如何基于Dataphin的資料分類分級和動态脫敏能力,實作資料研發過程中的敏感資料保護。本系列文章我們來針對資料安全使用過程中的一些小場景來提供一些最佳實踐,進而幫助大家更好的實作資料安全的建設。
資料安全作為合規管控的管理訴求,必然會對資料的使用和開發造成影響,我們下面簡單看下以下兩個場景:代碼查詢、生産資料寫開發環境/測試環境資料準備。
一、代碼查詢
1、正常情況下,我們進行代碼查詢時,可以直接查出明文的資料。
2、在安全子產品完成敏感資料的識别并且配置了脫敏規則
2.1、識别敏感資料
2.2、配置脫敏政策
3、再次進行代碼查詢,可以看到查詢到的資料已經變成了脫敏後的資料。
需要注意的是,開啟脫敏在保護敏感資料的同時,也會使得涉及敏感資料的查詢和分析變得困難,比如某本地生活服務商某個地區的訂單出現了大量投訴,卻因為脫敏保護隻能看到市級别的位址,不知道投訴的具體市哪個街道,也會影響實際的業務開展。需要按照業務實際需要做好敏感資料、脫敏規則的設計,減少對正常業務的幹擾;或者适時的開啟脫敏白名單,在可控的環境下,快速完成業務的分析需求。
二、生産資料寫開發環境/測試環境資料準備
1、正常情況下,為了不對生産資料産生幹擾,我們需要準備一份開發資料用于驗證腳本/程式是否正确。同時在涉及到個人隐私資料的時候,我們一般還需要對資料進行脫敏,比如md5函數處理,來保證開發環境沒有敏感資料。在這種情況下,每次在開發環境/測試環境準備資料都要小心翼翼,既害怕沒有脫敏導緻敏感資料洩漏,又害怕加密方式不對,導緻敏感資料完全失去原來的樣子。
3、被識别為敏感資料之後,可以看到,敏感資料在從生産環境寫到開發環境時,自動實作了脫敏,進而保證了生産環境的敏感資料不會意外洩漏,再也不用擔心造測試資料的時候資料洩漏了。
需要注意的是,開啟脫敏在保護敏感資料的同時,也可能會影響部分開發環境的驗證功能,比如腳本裡需要判斷手機号位數,卻選擇了md5算法,将11位的手機号變成了32位,導緻腳本無法識别。需要按照業務實際需要做好敏感資料、脫敏規則的設計,減少對正常業務的幹擾;或者适時的開啟脫敏白名單,在可控的環境下,快速完成業務的分析需求。
三、結語
開啟資料安全功能後,代碼查詢、生成測試資料這些常用的研發功能,在保證了安全的同時,也會使部分場景下的業務需求受影響。是否開啟安全模式、識别哪些敏感字段、保護哪些場景還是要根據法規的要求、業務的需求綜合來看;同時在規則制定之後,要和相應資料團隊的負責人進行溝通,及時同步開發過程中的變化,才能既保證業務正常開展,又保證合規安全。