生物特征識別的本質是認證服務方根據用戶提交的當前生物特征信息與該用戶注冊時生成的生物特征模板進行相似度比較,即認證服務方需事先獲取用戶的生物特征模板。然而,以指紋/人臉/虹膜/聲紋為代表的生物特征在具有便利性的同時也存在生物特征無法更新的缺陷,其特征模板一旦丟失,惡意服務商/攻擊者可以根據這些模板進行生物特征信息重構等操作,進而對其他信息系統實施欺騙攻擊,嚴重威脅用戶的生命財產安全。近年來,各類生物特征數據泄露事件層出不窮,印度國家身份系統Aadhaar曾遭遇超過10億用戶的數據庫泄露,其中包括指紋、虹膜等高度敏感數據;我國某人臉識別公司今年也發生了大規模數據泄露事件,包括人臉識別圖像及其采集地點等信息的680萬條記錄被拖庫泄露。
目前,生物特征數據泄露已經引起智能移動終端用戶、服務商和國家監管部門的廣泛關注。目前市場上尚無獨立第三方的生物特征驗證服務,其中一個主要的原因就是當前生物特征的采集、存儲、分發、驗證機制無法保證生物特征信息的隱私安全,應用開發商和用戶不得不妥協,選擇信任終端設備廠商,通過廠商提供生物特征驗證接口來實現認證功能,這無異于將應用的安全和用戶的隱私完全托付給了設備廠商。本項目的研究成果和產品,可以很好的解決這個問題,實現用戶、采集設備、驗證服務商和應用開發者之間的四權分立,在對用戶身份特征信息的隱私問題提供充分保障的同時,實現高效、安全的生物特征驗證功能。
本項目源自生物特征數據安全處理的實際需求,擬解決信息化時代的個人敏感信息處理的核心安全問題。如圖1所示,本項目面向生物特征識別服務中信息的隱私保護與安全發布痛點,形成以用戶為中心的個人生物特征保護機制,解決開放共享網絡環境下,生物特征信息的安全發布和使用問題,做到“脫敏分布存,多方協同用,能效平衡佳,隱私保障成”,為促進生物特征服務在移動支付、智能家居、智慧城市等領域的應用提供安全理論和技術支撐。
圖 1 生物特征服務面臨的安全挑戰
本項目計劃基于已有的面向密文數據存儲和計算的生物特征數據安全處理技術,開發涵蓋主流生物特征識別機制的生物特征數據安全處理模塊、系統和設備,形成功能豐富、滿足不同應用場景的系列產品,做到與已有各類生物特征數據利用系統的無縫對接。
具體產品形式是形成SaaS形式的生物特征驗證云、驗證SDK(軟件)和驗證模塊(硬件),生物特征驗證云實現生物特征的安全采集、脫敏處理、分布式存儲、隱私保護和安全發布等功能,并通過驗證SDK或驗證模塊同各種應用和設備進行交互,在這些應用和設備上實現具備充分隱私保障的生物特征驗證功能。
本項目研發的生物特征數據安全處理系統是一款集數據安全和傳統生物特征識別優勢一體化設計的數據安全軟/硬件系統。通過將定制的隱私保護技術與生物特征識別方案無縫結合,顯著增強生物特征識別服務中用戶生物特征數據的安全性。加速促進生物特征識別技術在移動支付、智能家居、智慧城市等領域的應用推廣。
本項目圍繞生物特征數據安全和實現效率開展研究,突破了如下三項關鍵技術,形成涵蓋生物特征識別服務全流程的數據安全使用框架。
圖 2 總體技術思路
1.基于密文的生物特征相似度精確匹配計算
針對生物特征識別過程中相似度精確匹配計算而言,最突出的特征是數據密文化、所有權與處理權分離、明密文非相關;最本質的問題是脫敏后的生物特征數據可用性降低、用戶終端計算資源受限;最大難點是基于脫敏數據的相似度精確計算。本項目提出了基于密文的生物特征相似度精確匹配計算方法。
通過在之前提出的系列密文數據快速處理算法的基礎上,通過將多方隨機擾亂、多項式聚合、可逆矩陣加擾等技術進行融合,提出密文相似度快速精確計算方法和基于密文的相似度計算陷門構造方法,突破基于同態加密的特定運算陷門構造、多維數據相似度安全協同計算、面向矩陣處理的可逆隨機擾亂算法等關鍵技術,解決基于脫敏數據的相似度精確計算技術難點。
該關鍵技術的突破將為面向生物特征識別服務的高效隱私保護方案構造提供理論基礎,推動資源受限場景下生物特征識別服務的有效應用。
2.面向服務全流程的隱私保護方案構建
對生物特征識別服務全流程的隱私需求而言,最突出的特征是應用場景繁雜、服務模式多樣、安全保護機制階段變化;最本質的問題是隱私保護機制組合的有效銜接問題;最大難點是面向差異化服務的數據全生命周期安全保護。本項目提出了面向服務全流程的隱私保護方案構建方法。
按“需求分析、特性提取、柔性組合、分層保護”的技術思路,基于形式化描述、頻繁項集挖掘、組合優化等方法,提出服務信息形式化描述方法和面向生物特征識別服務全流程的數據安全脫敏框架,突破服務模式多維度刻畫、隱私保護算法特性分析、安全保護機制最優組合等關鍵技術,解決差異化服務模式自適應的安全框架構建和涵蓋服務全流程特征數據全脫敏等技術難點。
該關鍵技術的突破將為各階段隱私保護算法的有效融合提供理論與技術基礎,支撐動態變化場景下生物特征識別服務全流程隱私保護體系構建。
3.基于多目標優化模型的安全效能均衡
對生物特征識別的隱私保護算法的實用需求而言,最突出的特征是安全性、可用性等指標隨應用場景動態變化;最本質的問題是綜合多種因素對隱私保護方案的量化評估與動態調整;最大難點是融合保護效果、資源能耗、服務質量的方案效能優化平衡部署。本項目提出了基于多目標優化模型的安全效能均衡方法。
基于本項目團隊核心成員提出的隱私度量與多目標優化等方面的工作,通過引入信息論、多目標優化、演化算法等多理論,從多維影響因素來建立隱私保護生物特征識別的量化評估機制,使用多目標優化實現動態的效能調整,突破安全性與可用性等多因素統一描述與量化評估、整體均衡的多目標優化等關鍵技術,解決隱私保護方案在差異化平臺上優化部署的瓶頸問題。
該關鍵技術的突破將為生物特征識別服務隱私保護方案的量化評估與動態調整提供理論與技術基礎,促進生物特征識別服務的推廣與應用。
工程樣機
掃碼關注,查看更多科技成果