首頁 > 2017商業銀行專項提升班主題曲

2017商業銀行專項提升班主題曲

互聯網 2021-12-09 03:46:45

原標題:開啟新紀元: 隱私計算在金融領域應用發展報告2021(完整版)

摘要

√隱私計算賽道的崛起,是由市場需求的產生、技術的演進、法律與政策的推動引發的。首先是2019年的「凈網行動」引發了金融科技領域對隱私計算的需求。與此同時,隱私計算技術經歷了2019年的技術普及和市場教育階段、2020年的大規模概念驗證和試點部署階段之後,在實際商業場景中達到基本可用。最終,一系列法律與政策的推出,使得隱私計算技術成為未來商業世界的剛需。

√ 隱私計算龐大的產業生態正在形成。在這個生態當中,包括數據源、數據使用方和為數眾多的中間服務機構。目前,入局隱私計算領域的廠商有十大類,其中包括:互聯網巨頭、雲服務商、有人工智慧背景的公司、有區塊鏈背景的公司、有大數據背景的公司、有安全背景的公司、軟體服務商、有金融科技背景的公司、有供應鏈金融背景的公司、從隱私計算技術出發的創業公司。

√ 目前,隱私計算領域的商業模式主要有三種:硬體銷售、軟體銷售、平台分潤。其中平台分潤模式有三種:數據源側分潤、數據應用場景分潤、類數據代理模式。但是,在未來,隨著隱私計算技術與區塊鏈技術進一步結合、以及開源的發展,可能出現更多的商業模式。

√ 在隱私計算領域發展初期,各廠商商業模式比較相似,並無明顯差異。但是基於目前業務方向以及能力的不同,隱私計算公司的商業模式可能在發展中產生分化。目前,在零壹智庫的調研中,我們看到了數據底座、與場景深度融合、隱私計算疊加數據運營、開放平台、「區塊鏈+隱私計算」基礎平台等幾種不同的業務方向。

√ 通過對隱私計算專利申請信息進行梳理,零壹智庫發現,中國目前有超過2000家公司參與隱私計算專利申請,但是成功推出相關產品的僅部分公司。在相關政策和行業法規的推動下,未來可能有更多的隱私計算產品推出。

√ 在金融領域,目前隱私計算主要應用於風控和營銷兩個方面。但是,隱私計算對金融領域的影響將不止於這兩個方面。隱私計算與區塊鏈技術結合之後,可以改變更多的金融場景,比如跨境支付、供應鏈金融等。

√ 2021年,隱私計算開始在真實商業場景中全面落地。但是,這距離隱私計算市場的全面爆發還有距離。這主要是基於以下三方面的原因:隱私計算技術自身的原因、市場的原因、宏觀環境的原因。隱私計算的長跑才剛剛開始。

出品 | 零壹智庫

作者 | 溫泉、姚崇慧、趙金龍

任萬盛、陳麗姍、劉翌

10月21日,由零壹財經•零壹智庫主辦的「第一屆中國信用經濟發展峰會暨2021第三屆數字信用與風控年會」在深圳前海舉辦,會上發布了《隱私計算在金融領域應用發展報告(2021)》。報告由零壹財經·零壹智庫作為研究機構,由中國科技體制改革研究會數字經濟發展研究小組、深圳市信用促進會、橫琴數鏈數字金融研究院聯合發布,並且得到了同盾科技、星雲clustar、瑞萊智慧、金智塔科技和天冕科技的研究支持。以下為完整版報告:【點擊「閱讀原文」,獲得PDF版報告】

目錄

前 言

一、隱私計算賽道崛起

(一)需求的產生:明文數據盛宴結束

(二)技術的演進:隱私計算技術達到基本可用

(三)法律政策的推動:隱私計算成為持續的剛需

二、隱私計算對數字經濟的影響趨勢

(一)隱私計算對科技產業的影響

(二)隱私計算對其他產業的影響

三、隱私計算的技術路徑

(一)隱私計算的定義

(二)隱私計算的技術流派

(三)隱私計算的技術標準

四、隱私計算產業圖譜與商業模式分析

(一)隱私計算的To B市場與To C市場

(二)隱私計算產業圖譜

(三)隱私計算公司商業模式與業務方向差異

五、隱私計算投融資與專利分析

(一)隱私計算投融資分析

(二)隱私計算專利分析

六、隱私計算在金融領域應用

(一)隱私計算在金融領域應用的開端

(二)創業公司湧現

(三)隱私計算落地金融機構

(四)隱私計算在金融營銷領域應用

(五)隱私計算在風控領域應用

七、隱私計算金融應用典型案例

(一)同盾科技

(二)星雲Clustar

(三)瑞萊智慧

(四)金智塔科技

(五)天冕科技

八、隱私計算在金融市場的推進節奏

作者目錄

致謝

前 言

2021年,隱私計算開始在真實的商業世界中全面落地。

這在實際生活中有一些不那麼引人注目的信號。我們能夠看到,不少隱私計算初創公司正在賣力地推廣產品,他們穿梭於各類人工智慧、數據、科技論壇,他們接受各路媒體採訪,宣講數字經濟的未來。我們也能看到,電信運營商、不少銀行、保險公司、證券公司都在進行隱私計算平台的招標採購。

隱私計算不再是隱居在論文中的生僻學術名詞,而是出現在公司官網上琳琅滿目的產品介紹,出現在各大展會中充滿科技感的酷炫展台,登上各種技術沙龍的最火熱的話題,金融機構業務中令人驚艷的數字,以及真金白銀。

數據要素市場不再是中央文件中的抽象概念,而是在技術支持下徐徐展開的可以想見的未來。

構成中國隱私計算市場未來的,是活躍在其中的互聯網巨頭、創業公司們。一切概念都變成了鮮活的產業實踐,一切未來都構築在行動之上。

為此,從隱私計算落地最為密集的金融業開始,零壹智庫將儘力展示隱私計算髮展中真實而鮮活的產業生態。讓產業實踐者們被看見、被發現。

隱私計算賽道崛起

2021年,隱私計算成為資本市場大熱的賽道。

經歷了2019年的技術普及和市場教育階段,2020年的大規模概念驗證和試點部署階段之後,2021年隱私計算進入真正嘗試規模化應用的階段。

這個賽道的崛起,源於市場需求的拉動和技術的日益成熟,同時法律與政策環境的變化也成為利好因素。

(一)需求的產生:明文數據盛宴結束

隱私計算市場的啟動是由監管的實質性行動引發的。無論從中國自身的發展來看,還是從美國和歐盟的情況來看,都是出於這一原因。

1、中國監管風暴啟動隱私計算市場

2019年9月,中國金融科技領域迎來一場前所未有的整頓風暴。

這場監管風暴源自2019年1月公安部組織部署全國公安機關開展的「凈網2019」專項行動。這次專項行動的目標是,依法嚴厲打擊侵犯公民個人信息、黑客攻擊破壞等網路違法犯罪活動。

「凈網行動」始自2011年,是由公安部發起的網路犯罪專項打擊行動。2011年首次「凈網行動」的主要打擊目標為網上涉槍涉爆違法犯罪活動。此後,隨著互聯網的發展,凈網行動的內容根據實際情況不斷變化。

「凈網2019」專項行動開始后,很快聚焦於對「套路貸」及其生態的打擊。根據公安部2019年11月14日在北京召開的通報全國公安機關開展「凈網2019」專項行動工作情況及典型案例的新聞發布會上披露的信息:

2019年5月25日,黑龍江省七台河市接到居民報案,之後七台河市公安局成立專案組,從本地被「套路貸」受害者和催收團伙入手,延伸打擊觸角、持續經營攻堅,偵獲一條集實施「套路貸」犯罪團伙、催收團伙以及幫助「套路貸」犯罪的技術服務商、數據支撐服務商、支付服務商的完整犯罪鏈條。

8月10日開始,上述專案組對「7·30」網路「套路貸」專案開展集中收網行動,打掉犯罪團伙9個,抓獲犯罪嫌疑人80名,查封凍結涉案資產7億元,提取各類涉案數據205T,涉及被催收人員7萬餘人。

在此過程中,公安部網路安全保衛局從這些案件線索出發,組織全國展開集群戰役。9月1日以後直至11月間,各地網安會同刑偵部門收網打掉團伙147個,抓獲嫌疑人1531名,採取刑事強制措施798名,剷除了一批幫助犯罪的技術服務商、數據支撐服務商、支付服務商,實現了對「套路貸」犯罪規模打擊、生態打擊。

在這場打擊當中,金融科技領域受到波及。據《財新》報道,2019年6月,公安部門鎖定「套路貸」、「714高炮」依賴導流獲客和暴力催收這兩大幫凶,利用爬蟲等工具,為這些「套路貸」平台爬取通訊錄等個人敏感信息,並引發命案。這些非法個人信息的主要提供者,不少來自大數據風控公司。

9月6日,位於杭州的大數據風控平台杭州魔蠍數據科技有限公司被警方控制,高管被帶走,相關服務癱瘓。此後,不少第三方風控行業頭部公司相繼被調查或被波及,使得整個行業主要爬蟲服務出於避險考慮基本暫停。對市場來說,這是監管層釋放的強烈信號,即用爬蟲爬取個人隱私數據(因為大數據風控當中不少數據涉及個人隱私)要付出巨大的代價。

這場整治,使得隱私計算成為一種可考慮的替代方案,市場洞然而開。

整治之前,爬蟲是大數據風控行業的靈魂——大多數大數據風控公司本身並沒有那麼多數據,因為數據是從業務當中來的,但是有大量數據源的機構實際上並不多,多數大數據風控公司的數據是靠爬蟲爬取。本來,用爬蟲來爬取公開數據並不違法,但是與個人信息強相關的數據對網路貸款的風險控制才是更直接有效的,在利益的驅使下,爬蟲爬取信息的範圍逐漸擴大,很多公司都利用爬蟲技術去抓個人隱私數據或者政府機關、銀行機構的數據。這些數據,是有網路貸款業務的機構用來做風險控制的主要依據。

整治之後,大部分爬蟲服務停止,市場不得不考慮替代方案。在這個過程中,數據的供需雙方開始重新看待數據的合規使用問題:一方面,一些有數據源的機構只願意與持牌金融機構合作;一方面,持牌金融機構,也要看合作方是否獲得了合法的數據源授權。

也正是在這場整治之後,發展隱私計算業務的公司迎來了市場機會——這在零壹智庫的調研中是有實例證明的。

2、Facebook和Google被罰啟動隱私計算應用

在隱私計算的發展方面,中國與全球是幾乎同步的。

在美國和歐盟,隱私計算技術的應用原因也如出一轍。這在互聯網巨頭Facebook和Google身上體現得尤為突出。

從2016年開始,Facebook在對外的廣告合作中特別關注隱私保護問題。Facebook廣告的用戶數據部門要與各類數據提供者展開密切合作,但同時又要確保數據不被泄露。

此前,Facebook曾遭遇過一場集體訴訟。

2015年4月,來自美國伊利諾伊州的民眾對Facebook提起訴訟。這場訴訟的關鍵在於,Facebook 在收集和存儲用戶的生物特徵數據時,沒有明確地告知用戶。此外,這個「標籤建議」功能在用戶使用軟體時是默認開啟的。作為全美範圍內擁有獨立生物特徵隱私法的三個州之一,伊利諾伊州擁有在用戶生物信息隱私保護方面最全面的法律。經歷了多年訴訟之後,Facebook最終選擇了和解方案,罰金支付總額達到了6.5億美元。

但是,2016年前後,全世界開始將隱私計算技術應用到業務中的公司不到10家,而且在絕大多數公司,隱私計算的重要性還沒有被提到非常核心的位置。

此後,在全球範圍內,大數據飛速增長引發的問題越來越嚴重。這在Facebook和Google身上也有明顯的體現。

2018年3月,媒體曝光,Facebook 5000萬用戶的信息被泄露。此事在世界範圍內激起了軒然大波。彼時,Facebook向美國聯邦貿易委員會(FTC)繳納了50億美元(約合人民幣341億元)的罰款,打破了類似罰款的金額記錄,被稱為「史詩級」罰款。

2018年第四季度,Google旗下社交網路服務 Google+ 爆出安全漏洞,可能多達 50 萬用戶的個人信息被泄漏。這直接導致Google+業務被關停,並將Google推上了法庭。

目前,Facebook正在隱私計算的應用方面採取實際行動。[ 《Facebook 重建廣告系統,個性化廣告即將改朝換代》]

2021年9月1日,Facebook 產品營銷副總裁Graham Mudd 在 Facebook 官網主頁上發布了一篇名為《Privacy-Enhancing Technologies and Building for the Future》(《隱私增強技術和面向未來的建設》)的文章。文中提到:「必須承認的是,數字廣告勢必要減少對個人第三方數據的依賴,這也是我們多年來一直投資建設一系列隱私增強技術,並與行業一同制定標準以支持下一時代的原因。」

目前,Facebook 正在重建廣告系統。Graham Mudd表示:「可以肯定的是,未來五年個性化廣告的發展對行業意義重大,提前投資將使我們所有客戶受益,並能幫助我們塑造未來廣告生態。因為數據與個性化幾乎佔據我們所有系統的核心位置,從廣告定向到優化再至度量,接下來 2 年內,Facebook 上幾乎所有系統都將重建,事實上這已經在進行中了。」

Google也在採取行動。2017年,Google在《聯合學習:協作機器學習沒有集中訓練數據》的博客文章中首次引入了「聯邦學習」的概念。

2021年 5 月 Google I/O 開發者大會發布 Android 12 的同時,宣布了隱私計算核心(Private Compute Core)。這是一項開源計劃,提供了一個沙盒式的安全環境,將智能回復、實時播放和字幕等服務與操作系統和應用程序的其他部分隔離。其目的是為了讓數據在用戶自己的設備上保持私密,並以保護隱私的方式利用雲。現在,Google 已經通過隱私計算核心服務(Private Compute Services)進一步加強了這一舉措。

9 月 9 日,Android & Play 安全和隱私產品副總裁 Suzanne Frey 在一篇博文中說,新套件將「在隱私計算核心和雲之間提供一個保護隱私的橋樑」。

Google 提到,很多 Android 功能利用機器學習來更新模型,為用戶提供較好的體驗。有了隱私計算核心服務,將確保這些更新通過私有路徑進行,如智能回復和實時字幕等隱私計算核心功能不會直接進入網路。這將通過利用專門的開源 API 來實現,這些 API 通過刪除個人身份信息(PII)來保護隱私,並使用聯邦學習、聯合分析和私人信息檢索等技術。

(二)技術的演進:隱私計算技術達到基本可用

在市場需求產生的同時,隱私計算領域的一些主流技術,包括多方安全計算、可信執行環境、聯邦學習等,也通過技術研究與攻關逐步達到基本可用的程度,並且目前正在實際業務場景的應用當中不斷提高完善。

首先看多方安全計算。

1982年,時任加州大學伯克利分校計算機系教授姚期智(姚期智先生後來回國,擔任清華大學交叉信息研究院院長,並且當選為中國科學院院士)提出了多方安全計算理論,受限於當時的算力水平,多方安全計算僅有理論上的可能性。這是因為,要完成相同的計算,密文計算要耗費的時間是明文計算的5-6個數量級,也就是幾十萬倍到幾百萬倍。這是無法實現應用的。

2014年起,出於科研需求,清華大學交叉信息研究院助理院長徐葳帶領清華大學「姚班」的學生,開始研究如何提升密文計算的效率,從而使得多方安全計算技術可以在實踐當中真正被應用。為了實現技術突破,徐葳和團隊對計算機科學分支領域中的中包括密碼學、安全協議、計算機系統、分散式計算、演算法、資料庫、編譯和晶元等方面進行了全方位的整合與優化。這項研究從各個領域中挖掘潛力來提升密文計算的性能。

經過不懈的努力,徐葳帶領團隊把密文計算要花費的時間從之前的5-6個數量級,降低到了目前的10—50倍;同時創建了明密文混合運算,大幅降低密文計算的比例。這種革命性的性能提升,使得多方安全計算初步具備了進入實際應用的能力。

此外,有不少產業實踐者也從不同角度對多方安全計算技術進行了優化。

比如,富數科技推出了抗合謀、無中間方的多方安全計算技術方案。這個方案使得在N方計算場景下,各數據參與方自始至終持有一份自有數據碎片在本地不公開,少於或等於N-1個合謀者都是不能獨自得到結果的。該方案能夠支持參與各方完全直連,無需任何第三方,解決了甲乙方安全建模找不到合適第三方的問題,讓合作各方獲得更加自主可信的數字空間。這個方案能夠幫助銀行、運營商等對數據安全極其嚴苛的組織,與合作機構開展多方安全聯合建模,提升精準營銷能力和風險評估水平,進一步推動了多方安全計算技術的應用落地。

再比如,2020年5月,矩陣元發布了基於密碼學的隱私開源框架——Rosetta。Rosetta設計的初衷是降低密碼學在應用中門檻太高的痛點。在實際當中,如果想要運用密碼學解決問題,但是如果沒有很高的數學基礎或者沒有學習過密碼學,相關演算法使用門檻太高。但是一些AI領域的專家、學者對於AI的應用,深度學習、機器學習的框架已經非常熟悉。所以,這兩種具有不同專業技能的人之間有很深的溝壑。Rosetta的發布,降低了密碼學技術的使用門檻。

再看聯邦學習。

零壹智庫在調研中了解到的對於聯邦學習最早的研究,來自四川大學華西醫院特聘研究員、同濟大學附屬普陀醫院客座教授、杭州鍩崴科技CTO王爽。王爽於2012年首先提出了聯邦學習框架應用於醫療在線學習,並於2013年發表在了專業SCI期刊上,論文題目是《EXpectation Propagation LOgistic REgRession (EXPLORER): Distributed privacy-preserving online model learning》。該論文提出了在不需要分享原始個體數據的情況下,利用多個數據源進行帶有隱私保護的聯合建模。同年王爽帶領的團隊發表了開源聯邦學習框架「WebGLORE: a web service for Grid LOgistic Regression」,該底層技術服務於多個醫療網路數據的聯邦建模需求。團隊並於2017年前又發表了十餘篇聯邦學習相關著作。

但是目前,在產業應用中,影響更大的是谷歌在聯邦學習上的探索。2016年,谷歌提出聯邦學習,用於解決安卓手機終端用戶在本地更新模型的問題,其設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私、保證合法合規的前提下,在多參與方或多計算結點之間開展高效率的機器學習。此外,2015年穀歌開源了機器學習框架Tensor Flow,後來Tensor Flow 成為世界上最受歡迎的開源機器學習框架。2019年,Tensorflow專門為聯邦學習推出了一個學習框架Tensor Flow Federated(簡稱TFF)。

2018年,國際人工智慧界「遷移學習」(transfer learning)技術的開創者、香港科技大學新明工程學講席教授、計算機科學和工程學系主任楊強出任微眾銀行首席人工智慧官。隨後,2019年初,微眾銀行正式開源全球首個工業級聯邦學習框架FATE(Federated Learning Enabler),並開始嘗試將聯邦學習應用於金融業務中。FATE的開源,使得聯邦學習在中國的應用門檻大幅降低。

最後看可信執行環境。

可信執行環境的概念來源於2006年Open Mobile Terminal Platform (OMTP)工作組提出的保護智能終端的雙系統解決辦法。即在同一智能終端下、除了多媒體操作系統,再提供一個隔離的安全操作系統。隨後,ARM公司於同年提出硬體虛擬化技術trustzone,並於2011年加入Global Platform為技術制定標準並開發落地的可信操作系統。2013年,Intel發布SGX指令集擴展,實現不同程序的隔離,在環境下執行的應用未經授權無法讀取或操作其他應用的數據或代碼。

當前,TEE代表硬體產品主要有ARM的Trustzone和Intel的SGX。國內外也誕生了很多基於硬體實現的商業化落地方案,例如Oasis Parcel,百度MesaTEE和華為iTrustee。

隱私計算的主流技術之外,硬體的算力加速對隱私計算進入更多的場景也功不可沒,在這方面也有不少廠商進行嘗試。例如,星雲Clustar通過對聯邦學習的不同應用分析,歸納總結出了11種影響計算效率的密碼學計算運算元,並創新式的將運算元中的公共部份抽取出來,形成核心模冪引擎,研發出了針對聯邦學習的首款FPGA加速卡。加速卡可以根據實時的任務需求將模冪引擎拼裝成不同運算元,給聯邦學習應用帶來全生命周期加速,進而帶給聯邦學習50-70倍的算力提升。未來通過軟硬體的進一步優化,可使這個倍數變為100倍以上。

算力的爆髮式提升意味著未來隱私計算將成為所有計算的默認配置,無感地融入到人工智慧等領域中,也意味著隱私計算技術可以進入越來越多的應用場景。

據零壹智庫2021年5月調研了解,隱私計算運算速度目前不能一概而論,計算速度最快的耗時是明文計算的3—5倍,計算速度最慢的耗時達到明文計算的上百倍。運算速度與多種因素相關,其中包括演算法類型、數據規模、數據特徵、軟硬體環境、伺服器性能、網路帶寬、硬體加速等。

這個數字,聽上去仍是一個不小的差距,但是在很多場景,已經可以接受,達到初步可用。

以富數科技的金融風控場景為例。比如最早期訓練一個邏輯回歸的風控模型,同樣的樣本和特徵數量,聯邦學習的建模耗時是明文的數十倍。隨著演算法和工程的優化,甚至是硬體加速的結合,聯邦學習的性能大大提高,富數科技做過最快的邏輯回歸測試,1分鐘的明文訓練數據規模,甚至可以在3~5分鐘內用聯邦學習完成。

再以華控清交目前在與多家銀行嘗試合作的生物特徵保護的人臉識別場景為例,需要將人臉特徵和身份證信息進行比對的場景,明文計算耗時幾十毫秒,用多方安全計算的耗時已經降到低於1秒。雖然隱私計算耗時仍是明文計算的10多倍,但是在現實應用場景中已經基本可以接受。

隱私計算的性能還在不斷優化當中。比如,華控清交在2021年5月向零壹智庫預測,在未來一年左右的時間裡,要做相同的計算,多方安全計算的平均耗時有可能可以優化到明文計算的5-10倍。

(三)法律政策的推動:隱私計算成為持續的剛需

在市場需求產生,技術基本達到可用的情況下,法律和政策環境也在朝著保護個人隱私的方向推進。

近年來,通過立法加強數字經濟下的數字安全及個人信息保護已經成為世界性的趨勢。同時,數字經濟下數據的戰略地位凸顯,相關支持政策頻出。

1、立法進展

1.1 歐盟GDPR生效

歐洲議會於2016年4月通過的《歐盟一般數據保護條例》(General Data Protection Regulation,GDPR),於2018年5月25日在歐盟的28個成員國生效。該條例適用於所有歐盟成員國的個人信息保護,任何收集、傳輸、保留或處理涉及到歐盟成員國內的個人信息的機構組織均受該條例的約束。

GDPR被認為是史上最嚴的數據保護法規,促進了全球更為嚴格的個人信息保護趨勢。由於其約束力超越了歐盟這一地理範圍,覆蓋到在歐盟有相關業務的國際機構組織,GDPR實際上重構了國際個人信息保護標準。諮詢公司埃森哲在一份報告中認為GDPR是「近二十年來數據隱私規則領域發生的最重要變化」。

GDPR強調責任共擔,數據供應鏈上的各方都要承擔責任,改變了過去由收集和使用數據的數據擁有者負責保護數據的規則,要求數據處理者也要承擔合規風險和義務。

GDPR對於違規的處罰極為嚴厲,處罰金額高達2000萬歐元或企業全球年營業額的4%(二者取較高值)。2021年7月,亞馬遜因為對個人數據的處理不符合GDRP被歐盟開出了7.46億歐元(約合8.88億美元)的巨額罰單。

1.2 美國CCPA實施

2018年6月28日,《加利福尼亞州消費者隱私保護法案》(CCPA)經州長簽署公布,並於2020年1月1日起正式實施。

CCPA從消費者保護的角度,規定了個人信息處理者的義務,包括「必須披露收集的信息、商業目的以及共享這些信息的所有第三方;企業需依據消費者提出的正式要求刪除相關信息」,等等。在處罰方面,CCPA規定違法企業面臨支付給每位消費者最高750美元的賠償金,以及最高7500美元的政府罰款。

加州的矽谷是互聯網企業的集聚地,包括世界上著名的行業巨頭如微軟、谷歌及亞馬遜等,所以CCPA的影響會通過這些互聯網企業向外輻射;另一方面,CCPA的約束範圍覆蓋了處理加州居民個人數據的營利性實體,從這個角度,與GDPR一樣,給相關跨國企業帶來影響。

1.3 中國國內法律框架體系成形

關於個人信息保護及數據安全的立法及監管,與歐美等西方國家相比,中國國內相對滯后。但隨著近年來侵犯個人信息的現象頻發,甚至出現了非法獲取,泄露、濫用,倒賣個人信息的「黑產」,侵犯個人信息與網路詐騙及敲詐勒索等犯罪行為合流,國內的相關立法及監管也逐步完善,監管趨於嚴格。

在數據安全及個人信息保護方面,中國目前已經形成了包括民法、刑法及單行法在內的法律框架體系。

刑法具有最高的保護和約束效力,2017年6月,《最高人民法院、最高人民檢察院關於辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》開始施行,明確了侵犯公民個人信息罪的定罪量刑標。

2021年7月,最高人民法院發布的《最高人民法院關於審理使用人臉識別技術處理個人信息相關民事案件適用法律若干問題的規定》,明確了人臉識別技術應用的法律邊界。

2020年5月通過的《中華人民共和國民法典》中將人格權單獨成編,對個人信息受法律保護的權利內容及其行使等作了原則規定。

在單行法方面,2017年6月,《網路安全法》開始施行。2021年,《數據安全法》及《個人信息保護法》通過,並分別於9月及11月開始施行。

表:數據安全及個人信息保護方面的法律及相關解釋(按時間順序)

數據來源:零壹智庫整理

《數據安全法》及《個人信息保護法》的通過與實施是2021年以來數據領域法制建設的重大進展。

這兩部法律的實施標誌著數據安全及個人信息保護的法制治理進入系統化和專門化的新階段,將進一步提升整個社會的守法意識,也將促進數據相關企業嚴守業務邊界,合法合規經營;而法制環境的完善,也將促進整個數據產業的健康發展,為隱私計算行業的發展帶來契機。

2、政策推動

在法律不斷完善的同時,政策也成為隱私計算市場發展的助推器。

未來,數據將成為新的生產要素,釋放數據紅利對未來推動數字經濟高質量發展至關重要。

2019年,新型冠狀病毒疫情過後,全社會都更加認識到數字化發展的重要性。2020年開年之後出台的一系列政策,都對隱私計算市場的發展形成有力推動。

表:數據相關政策文件(按時間順序)

數據來源:零壹智庫

根據零壹智庫調研了解,政策的出台對市場的影響是巨大的。比如隱私計算廠商在拓展政務市場時,能明顯感受到,政策出台後地方政府相關部門對隱私計算技術的嘗試更加積極。

法律和政策環境的變化,一方面使得對個人隱私的保護成為持續穩定的市場需求,而非短暫的應對監管的行動;另一方面使得對數據價值的充分應用和挖掘的行為受到正面肯定。客觀上,數據價值挖掘和個人隱私保護成為必須并行兼顧的社會目標,這使得隱私計算成為現實中的剛需。

隱私計算對數字經濟的影響趨勢

作為當下實現數據「可用不可見」的唯一技術解,隱私計算將對未來的科技產業以及實體經濟的關鍵領域產生重要影響。

在科技產業,隱私計算對人工智慧、區塊鏈、大數據技術的發展都將產生巨大的影響,並且隱私計算對這三個領域的影響是相互關聯的。

在實體經濟的金融、醫療、政務、零售乃至更多的領域,隱私計算的應用將為產業發展帶來新的躍遷。目前,我們了解到的隱私計算在金融、醫療、政務領域的應用是最多的。

(一)隱私計算對科技產業的影響

1、對大數據產業的影響

隱私計算將重塑大數據產業。

首先,隱私計算技術是大數據行業處理數據合法化的剛需。《數據安全法》強調,產業需要平衡數據安全與應用發展。隱私計算將成為平衡的關鍵技術支點。隱私計算致力於為數據獲取、共享、利用提供全周期的安全保障,搭建各類數據的隱私協作基礎,降低了數據泄露的風險、杜絕了明文數據留痕造成的價值遞減風險。

第二,隨著數據流通的安全化,以往較為敏感的數據領域逐漸開放。以政務數據為例,隱私計算使聯合政務、企業、銀行等多方數據建模和分析成為可能,進一步釋放數據應用價值,創造了多樣化的應用機遇。

2、對區塊鏈產業的影響[ 該部分主要觀點源自零壹財經調研信息,部分表述參考了鈦媒體報道《翼帆數字科技創始人夏平:區塊鏈最大應用前景是數據的流通與融合》,https://mp.weixin.qq.com/s/N7Wk1o9ULGIIrrNrxom1zQ。]

根據零壹財經的調研信息,綜合來看,隱私計算與區塊鏈相結合,可以建立更大範圍的數據協同網路。在未來,這可能形成數據流通的基礎設施。

區塊鏈技術可以用於解決數據資產的流轉問題。區塊鏈技術起源於密碼學的小圈子,區塊鏈最初提出的目的,是針對密碼學的這個圈子裡面提出的一個具體問題的解決方案——如何實現安全、可靠、無可辯駁的把一筆資產從A轉給其完全陌生的B。比特幣的誕生,就是為了解決這個問題。

但是,只應用區塊鏈技術,又不能完全解決這個問題。數據的流通和傳統資產的流通,有一個關鍵的不同,那就是數據的流通需要解決數據的安全和隱私保護問題。如果這個問題不解決,數據就流通不起來。

數據本身的加密和安全問題,隱私計算技術可以解決。

因此,對於數據資產的流轉來講,沒有隱私計算,不能解決數據本身的安全和隱私保護問題;沒有區塊鏈,不能解決數據的確權問題以及在更大範圍內的數據網路協作問題。區塊鏈和隱私計算二者結合,是目前能夠看到的建設大規模數據流通網路的途徑之一。

3、對人工智慧產業的影響

隱私計算與人工智慧的結合,未來可以使得人工智慧突破數據瓶頸,開啟新一輪增長。

近幾年來,由於缺乏可用的數據,人工智慧的發展遭遇瓶頸。

一方面,政府和個人對於數據隱私保護的需求日漸增強。隨著數據價值的凸顯,以及信息泄露醜聞的頻發,公眾明顯感覺隱私泄露的弊端遠超過AI本身帶來的便利和智能。

另一方面,企業將數據要素作為核心資產,不願意在公開透明的環境下共享流通。因此,人工智慧企業缺少可用數據優化模型,阻礙了模型精度的進一步提升。

隱私計算技術成為破局之道,可以為AI模型提供多樣化的數據資源。

(二)隱私計算對其他產業的影響

對於那些產生大量數據,而又迫切需要數據交換與融合應用的領域,包括金融、醫療及政務等領域,隱私計算技術將帶來深入影響。

1、對金融行業的影響

在金融領域,目前隱私計算主要應用於風控和營銷兩個方面。

在金融機構金融信貸業務的風控環節,隱私計算可以幫助金融機構將自身和外部數據聯合起來進行分析,從而有效識別信用等級、降低多頭信貸、欺詐等風險,也有助於信貸及保險等金融產品的精準定價;同樣,內外部多方數據的共享融合也有助於提高金融機構的反洗錢甄別能力。

在金融機構的產品營銷環節,通過應用隱私計算技術,可以利用更多維度的數據來為客戶做更加精準的畫像,從而提升精準營銷的效果。

但是,隱私計算對金融領域的影響不止於這兩個方面。隱私計算與區塊鏈技術結合之後,可以改變更多的金融場景。

比如,在支付場景下,傳統的支付過程中,支付的服務方和中間參與者都可以獲取交易雙方的身份和交易金額,存在嚴重的信息泄露風險。而通過隱私計算技術,可以將交易雙方的敏感信息「隱匿」。這種隱匿支付技術應用在供應鏈金融領域,能夠防止信息泄露帶來價值損失,同時保護了各方隱私,有利於打破供應鏈金融中的信息孤島和互通困難等問題。在跨境支付領域,隱匿支付能夠提高用戶對支付行為的信任,有利於降低跨境支付成本,提升支付效率。[ 微眾銀行《WeDPR方案白皮書》,2020年1月。]

2、對醫療行業的影響

目前隱私計算的商業落地較多地集中在金融行業,而醫療是非常有潛力的一個領域。醫療領域聚集了大量的診療數據,而這些數據具有很強的隱私性,是各方實現數據共享的一大障礙。隱私計算的切入對於這些數據的融合應用在分級診療、醫療資源共享、醫藥研究以及輔助診療提高準確度等方面發揮作用提供了保障,有助於整體上提高公共衛生服務水平。

3、對政務領域的影響

以往,各政府機構的信息管理系統建立在部門內部,相互之間缺少橫向聯通,同時出於數據安全及隱私保護,對於數據分享相對謹慎,政務數據的共享及融合應用與數字經濟發展的需求之間仍存距離。

隱私計算的切入,能夠在保護數據安全和個人隱私的前提下,實現政府不同部門之間的互聯互通及數據共享,包括司法數據、社保數據、公積金數據、稅務數據、水電燃氣數據、交通數據等等,從而促進政府不同部門的協同,提高政府的效率以及決策質量。

同時,隱私計算加持下,政務數據可以向社會開放,為企業或學界所用,釋放更多價值;同時,民間的數據源也可向政府開放,提高政府在決策以及政務流程等方面的效率。

隱私計算的技術路徑

本章將簡明扼要地為大家梳理隱私計算的概念、主要技術流派和應用標準,以使得大家對隱私計算技術本身有更清晰的認識。

(一)隱私計算的定義

隱私計算是「隱私保護計算」(privacy-preserving computation)的中文簡稱,根據「大數據聯合國全球工作組」(Bigdata UN Global Working Group)的定義,這是一類技術方案,在處理和分析計算數據的過程中能保持數據不透明、不泄露、無法被計算方以及其他非授權方獲取。

大數據聯合國全球工作組成立於2014年,由31個成員國和16個國際組織組成。早在2018年,工作組就致力於促進各國多個統計局相互進行敏感大數據協作,是最早研究隱私計算的國際組織之一。2019年,該工作組出台了《聯合國隱私保護計算技術手冊》,以方便各國統計局以安全適當方式訪問新的 (敏感)大數據源。

需要注意的是,隱私計算不是指某一個具體的技術,而是一個範疇和集合。可信執行環境、多方安全計算、聯邦學習等都屬於隱私計算技術。

(二)隱私計算的技術流派

隱私計算技術是在保護數據本身不對外泄露的前提下,多個參與方通過協同對自有數據處理、聯合建模運算、分析輸出結果、挖掘數據價值的一類信息技術。 作為跨學科技術,隱私計算涉及密碼學、機器學習、神經網路、信息科學,同時可與人工智慧、雲計算、區塊鏈分散式網路等前沿技術融合應用,為數據保護和價值融合提供技術可行性。

從技術實現原理來看,隱私計算有兩種分類方式。

一種是將隱私計算技術分為兩個方向——可信硬體和密碼學。可信硬體指可信執行環境(TEE),主要依靠硬體來解決隱私保護問題;密碼學以多方計算、聯邦學習為代表,主要通過數學方法來解決隱私保護問題。

另一種是將隱私計算分為三個方向。由於聯邦學習是密碼學、分散式計算、機器學習三個學科交叉的技術,目前更常見的是三分類法,即分為密碼學、可信硬體和聯邦學習三個流派。以密碼學為核心技術的隱私計算以多方安全計算、同態加密為代表;可信硬體以可信執行環境為主導;「聯邦學習類」泛指國內外衍生出的聯邦計算、共享學習、知識聯邦等一系列名詞,是指多個參與方聯合數據源、共同建模、提升模型性能和輸出結果準確性的分散式機器學習。

1、多方安全計算

多方安全計算(Secure Muti-Party Computation,MPC)理論,是1982年時任加州大學伯克利分校計算機系教授姚期智為解決一組互不信任的參與方在保護隱私信息以及沒有可信第三方的前提下的協同計算問題而提出的理論框架。后經Oded Goldreich、Shafi Goldwasser等學者的眾多原始創新工作,多方安全計算逐漸發展為現代密碼學的一個重要分支。多方安全計算能夠同時確保輸入的隱私性和計算的正確性,在沒有可信第三方的前提下通過數學理論保證參與計算的各方輸入信息不暴露,而且同時能夠獲得準確的運算結果。

多方安全計算通常藉助多種底層密碼框架完成,主要包括不經意傳輸(Oblivious Transfer,OT),混淆電路(Garbled Circuit,GC),秘密共享(Secret Sharing,SS)和同態加密(Homomorphic Encryption HE)等。

不經意傳輸是指數據傳輸方發出多條信息,而接收方只獲取其中一個。由於傳輸方不確定最終到達的信息是哪一條,接收方也無法得知未獲取的其他信息,從而雙方的數據都處於隱私狀態。

混淆電路是最接近「百萬富翁」解決方式的思路。多方參與者利用計算機編程將輸入的計算任務轉化為布爾值,對輸入的具體數值加密,因此多方在互相不掌握對方私人信息時,可共同完成計算。

秘密共享是對加密信息的隨機切分過程,將信息的片段分散至多個參與方保管。因此除非超過一定數量的多方協同合作,否則無法還原完整的數據並進行解密。

由於多方安全計算通常使用前三種框架便能實現,同態加密也被部分人士認作獨立於安全多方計算而基於密碼學的技術。同態加密指能實現在密文上進行計算后對輸出進行解密,得到的結果和直接對明文計算的結果一致。該概念最早在1978年由 Ron Rivest、 Leonard Adleman和 Michael L. Dertouzo提出。按照支持的功能劃分,目前大致可以分為全同態加密和部分同態加密。全同態加密可以在加密態密文的狀態下對數據進行各種運算,而部分同態加密只能對密文進行無限次同態加法或無限次同態乘法操作。

多方安全計算技術通用性高、準確性高,行業內也肯定了演算法的理論價值和應用前景。即使密碼和開發的難度導致其性能中等,密碼學領域也有一半以上的學者研究多方安全計算的相關話題。作為發展歷史最長、相對更成熟的技術,多方安全計算技術成為了各科技大廠和新秀的技術路徑之一。

2、可信執行環境(TEE)

可信執行環境作為易開發、高性能的隱私計算技術,與硬體提供方存在強依賴關係。其實踐路徑表現為:在CPU內劃分出獨立於操作系統的、可信的、隔離的機密空間。由於數據處理在可信空間內進行,數據的隱私性依賴可信硬體的實現。

3、聯邦學習

聯邦學習(Federated Learning)從技術層面上涉及隱私保護、機器學習和分散式領域,能有效地滿足數據在不出本地的情況下,實現共同建模,提升模型的效果。

根據特徵空間和樣本ID空間的不同,聯邦學習分為橫向聯邦、縱向聯邦和聯邦遷移學習。

橫向聯邦學習適用於特徵重合較多、樣本重合較少的聯合計算場景。但通過構建聯邦生態,參與者可以聚合更多的數據樣本,從而解決單邊建模數據不足的情況。例如,某銀行在不同區域設立分行,由於商業模式相同,數據擁有重合度較高的特徵,但各行服務不同地區的客戶,樣本重合較少,這種情況就可以應用橫向聯邦學習。

縱向聯邦學習適用於樣本重合較多、特徵重合較少的聯合計算場景。通過建立聯邦生態,參與者可以豐富樣本特徵,實現更精準的樣本描述。例如,服務同一群體的銀行與電商平台就可以採用縱向聯邦學習。

聯邦遷移學習是對橫向聯邦學習和縱向聯邦學習的補充,適用於特徵、樣本重合均少的場景。例如,不同地區的銀行和商場之間,用戶空間交叉較少,並且特徵空間基本無重疊。

聯邦學習在國內隱私計算賽道得到了廣泛的應用,如微眾銀行FATE開源平台,平安科技「蜂巢」、百度開源框架PaddleFL、位元組跳動Fedlearner平台。此外,一些隱私計算創業公司也在通過聯邦學習技術的探索與應用,積極入局,如星雲Clustar。

(三)隱私計算的技術標準[ 這裡,階段的劃分參考了富數科技合伙人黃奉孝的文章《說說國內隱私計算行業標準的三個階段》https://zhuanlan.zhihu.com/p/366155666。]

按照標準內容和參與機構,國內的隱私計算標準大致能夠分成三個階段。從理論層面、測評層面到互聯互通層面,三個階段下隱私計算標準的實用性和覆蓋範圍逐漸提高。隱私計算標準的參與和發布機構由企業和行業機構也逐漸轉向國家和國際層面的機構。值得注意的是,隱私計算相關的技術標準仍在制定中。

1、第一階段

第一個階段標準在定義和框架上給出了解釋,這個階段更加關注理論,主要滿足科研性實驗性課題。此外,參與制定標準的機構主要為企業和行業機構。

2、第二階段

第二階段的標準在性能和工程化安全方面給出了測評標準,讓隱私計算從理論框架層面過渡到支持測評的實踐方面,從企業實踐方面提升了隱私計算標準的可用性。其中,「可信隱私計算」產品測評體系作為對隱私計算產品的功能和性能進行評測的標準,受到廣泛的認可。

3、第三階段

第三階段的標準強調互聯互通,主要針對隱私保護措施帶來的數據孤島問題。這個階段還伴隨著國際和國家層面機構參與到隱私計算的標準制定。其中,《隱私保護機器學習技術框架》是首次通過隱私計算技術領域的國際標準;《隱私保護的數據互聯互通協議規範》是隱私計算互聯互通的首個國家標準。

隱私計算產業圖譜與商業模式分析

目前,隱私計算市場尚處於發展的初期。

從服務對象來看,在中國國內,隱私計算市場目前主要是一個面向企業的市場。但是在美國,已經出現了通過為企業提供隱私計算服務從而間接為個人提供隱私保護服務的模式,未來很有可能出現直接為個人提供隱私保護服務的應用。

從行業發展成熟度來看,在中國國內,隱私計算市場的剛剛開始啟動,應用剛剛落地,一切都正在嘗試和探索當中。

零壹智庫在調研中發現,入局隱私計算的廠商背景相當多元化,這也從一個側面印證了隱私計算這項技術將有可能影響到許多相關技術領域。

(一)隱私計算的To B市場與To C市場

如本報告前文所述,目前,在國內外,隱私計算主要是用在企業與企業之間的數據交互方面。因此,在現階段,在全球範圍內,隱私計算主要是一個To B市場。隱私計算廠商主要是通過為企業提供服務,起到保護個人隱私的作用。

未來,隱私計算有出現To C市場的可能性。

目前,個人數據主要是被分散存儲在各種各樣的場景應用中。比如,個人用戶使用信用卡貸款,個人身份信息、貸款和還款的信息就會被存儲在銀行的信用卡中心。個人用戶在網上購物,個人姓名、手機號、家庭住址、購買的物品和價格信息就會被存儲在電商賬戶中。

因此,目前的個人隱私保護在很大程度上要依賴各類企業對個人信息的保護。如果信用卡中心、電商公司、打車App、各級政府的信息系統沒有保護好個人信息,個人信息就有泄露的可能。

未來,有可能出現新的為個人提供信息保護的應用。這一預測來自零壹智庫對加州大學伯克利分校教授、Oasis Labs創始人兼首席執行官宋曉冬的訪談。宋曉冬用「Data Vault(數據金庫)」來描述未來可能出現的這一類新的應用。她認為隱私保護將逐漸落實在每個人身上,讓個人成為數據的主人、並且從隱私的保護和分享中受益是大勢所趨,要實現這一進程可能耗時不會超出10年的時間。

(二)隱私計算產業圖譜

1、隱私計算產業生態

隱私計算的產業生態當中,包含甲方、乙方和丙方三方。

甲方指的是數據使用方。目前,這些機構集中在金融、政務、醫療、零售等幾個領域。金融機構包括銀行、保險等機構,其中銀行數量最多。政務,各地政府部門,主要是實現政府不同部門之間的互聯互通及數據共享,從而促進政府不同部門的協同,提高政府的效率以及決策質量。醫療機構,包括各地各級醫院、藥廠等。

乙方,指的是數據源。目前金融類數據主要集中在政府、運營商、銀聯、互聯網巨頭手中。醫療數據在各地各級醫院、醫藥公司、醫保機構的系統里。政務數據主要包括是工商、司法、稅務、海關、學歷學籍等各政府職能部門日常運行積累的數據。政務數據,部分省市有政務數據共享平台和政務數據開放平台,但大多數數據往往散見於各地政府的各職能部門,難以互聯互通,只有少數部門的數據是全國性的,其他數據都較為分散,即使是已經公開的信息很多也並不完整。

丙方,指的是不擁有數據的服務機構,比如隱私計算廠商、雲服務商、大數據服務商等。他們可能服務於數據源或者數據使用方,數據可能存放在他們的系統里,但是數據不屬於他們。

圖:隱私計算產業生態

製圖:鄭喬丹、陳麗姍、張艷茹

2、隱私計算廠商圖譜

在業界,目前提供隱私計算服務的廠商大致可以分為幾類:

第一類,互聯網巨頭。

目前,阿里巴巴、螞蟻集團、微眾銀行、騰訊集團、百度集團、華為集團、京東集團、位元組跳動等都互聯網巨頭都已經開始在隱私計算方向發力,旗下多個業務板塊都推出了隱私計算產品。

第二類,雲服務商。

目前,阿里雲、騰訊雲、百度雲、京東雲、金山雲、華為雲、優刻得等雲服務商都推出了隱私計算服務。

第三類,人工智慧背景的公司。

比如瑞萊智慧、醫渡雲、三眼精靈、淵亭科技。

第四類,區塊鏈背景的公司。

比如矩陣元、Oasis、ARPA、趣鏈科技、零幺宇宙、宇鏈科技、翼帆數科、熠智科技、算數力、同濟區塊鏈等。

第五類,有大數據背景的公司。

比如星環科技。

第六類,有安全背景的公司。

比如阿里安全、騰訊安全、百度安全、安恆信息、神州融安、瓶缽科技、沙海科技等。

第七類,軟體服務商。

比如普元信息、神州泰岳。

第八類,有金融科技背景的公司。

比如同盾科技、百融雲創、富數科技、天冕科技、金智塔科技、冰鑒科技、甜橙金融等。

第九類,供應鏈金融背景的公司。

比如聯易融、紙貴科技等。

第十類,從隱私計算出發的初創公司。

如華控清交、星雲Clustar、數牘科技、藍象智聯、洞見科技、鍩崴科技、翼方健數、衝量在線、光之樹、融數聯智、摩聯科技、隔鏡科技、神譜科技、同態科技、凱馨科技、煋辰數智等公司。

圖:隱私計算廠商圖譜

製圖:鄭喬丹、陳麗姍、張艷茹

(三)隱私計算公司商業模式與業務方向差異

1、商業模式

據零壹智庫調研了解,隱私計算公司目前有三種商業模式:

第一,硬體銷售。目前在隱私計算領域,有兩種硬體,一種是FPGA加速卡,一種是隱私計算一體機,都是使用硬體提升隱私計算性能,更加符合實際應用場景需求。比如星雲Clustar隱私計算軟硬體一體機、螞蟻摩斯隱私計算一體機等。

第二,軟體銷售。就是銷售隱私計算系統軟體,大多數有隱私計算業務的公司都有這樣的系統軟體,比如螞蟻摩斯多方安全計算平台、華控清交PrivPy 多方安全計算平台、同盾科技智邦平台iBond、瑞萊智慧隱私保護機器學習平台RealSecure、金智塔科技的「金智塔」隱私計算平台、天冕科技的天冕聯邦學習平台WeFe、富數科技阿凡達安全計算平台、洞見科技INSIGHTONE洞見數智聯邦平台、藍象智聯GAIA平台等。

第三,平台分潤。隱私計算公司軟體銷售積累了一定數量的客戶之後,客戶通過軟體平台調用數據,獲得收益之後,隱私計算公司可以獲得這方面的收入。

分潤有三種方式:

其一,數據源測分潤。即根據數據調用量,在數據源收益中分潤。

其二,數據應用場景分潤。在金融應用中,隱私計算主要應用於金融業務的風控和營銷場景,可以從場景取得的收益中分潤。

其三,類數據代理模式。向數據源採購數據,加工成評分之後進行銷售,整個過程中應用隱私計算技術。銷售評分的價格,是在數據採購成本的基礎上進行加價。

但是,目前開源正在成為潮流,這使得在未來可能出現新的隱私計算商業模式。

在中國,隱私計算的開源是從微眾銀行的隱私計算系統FATE開始的。2019 年 7月,微眾銀行一共發布了10款開源軟體,其中就包括FATE——第一個開源聯邦學習系統,開創了隱私計算系統開源的先例。

當下,零壹智庫了解到,在隱私計算領域,還有更多的公司已經或者正在加入開源的行列。比如,2020年初,位元組跳動聯邦學習平台 Fedlearner 開源。2020年5月,矩陣元隱私AI開源框架Rosetta發布。星雲Clustar在FATE開源社區內開源了解決針對FATE平台自身存在的一些問題的方法,如解決FATE進程間通信問題的經驗、技術、研究成果等。天冕科技聯邦學習平台WeFe開放了全部源碼,包含用戶操作中心Board、網關GateWay、演算法Kernel以及聯邦基礎設施Union等核心技術,共約30萬行代碼。富數科技也在考慮開源計劃,並且倡導開源項目之間也要採用開放的、兼容的、公共的技術協議。

對於B端,開源也在市場上逐漸發展為成熟的商業模式。主要的三種商業模式有:第一,在軟體開源提供后,以軟體後期的運維、部署、諮詢、升級等技術手段盈利;第二,發行企業版與開源社區版雙版本,企業版以服務於一些特點企業應用場景進行盈利;第三,通過將開源軟體部署在雲端伺服器,需求方通過訂閱的方式向提供方付費使用,同時這種模式也免去了實地部署等線下的過程與以及安裝費用。

因此,以後如果有更多的隱私計算平台開源,將可能發展出更多的商業模式。

2、不同的願景與方向

在市場發展初期,各公司的商業模式非常相像。據零壹財經了解,目前巨頭和隱私計算創業公司在隱私計算業務上的收入來源,都是前文所述商業模式的不同組合,並無特別明顯的差異。

但是他們各自的身份、願景、目標和技術特點並不完全相同,在未來的發展中,行業格局和這些公司在市場上各自的定位分工很有可能會據此產生變化。

2.1 數據底座

致力於做數據底座的公司,業務的重點在於為數據流通建立安全的技術和設施底座,為數據安全流通「修路架橋」,主要不是提供其上層的風控建模、營銷等方面具體應用產品和服務。他們更加傾向於通過合作為其他公司提供底層技術平台,而非自己去提供具體的應用開發和服務。

華控清交致力於做數據流通基礎設施建設,是這一方向的典型代表。

基於多方安全計算等密碼學理論的隱私保護計算和數據流通技術、標準和基礎設施的技術和產品體系是華控清交的核心,能夠滿足廣泛用戶群體保護多方數據隱私且實現協同計算的基本需求。在此基礎上,用戶可以結合實際場景以及自身實際需求,通過增加相關模塊(包括存證模塊、研發輔助模塊、AI計算模塊、緩存模塊、SQL模塊、明密文協同計算模塊等功能模塊)對標準平台進行補充以實現更全面的功能。

在華控清交的商業模式中,有一個突出的特點:華控清交不碰數據。在公司發展初期,華控清交的收入主要來源於項目收入,項目收入主要是技術和解決方案的銷售收入。目前,華控清交已經進入了產品銷售階段。未來,預計華控清交的收入主要來自於技術和產品賦能以及數據流通生態建設和服務。但是,目前商業模式尚未完全成熟,需要在未來的商業實踐中進行不斷探索。

華控清交之外,也有更多的公司在這一方向進行探索。比如,翼帆數科等。

2.2 與場景深度融合

更加註重與場景深度融合的公司,在提供隱私計算軟體系統之外,在為場景方提供服務方面有更多的積累。並且,其在服務全程中需要配置更多的資源來服務這一戰略方向。在未來的收入結構中,他們從場景方的收益中獲得的分成也將佔比不低。

洞見科技是這一方向的典型代表。

在資源積累、技術發展、市場推廣方面,洞見科技的行動都展現出與場景深度融合的能力與傾向。

首先看資源積累。對於數據資源,在市場化數據、生態數據、政府數據方面,洞見科技都有較為深厚的積累。

其次看技術發展。洞見科技在技術與場景進行深度融合方面走得更遠,這主要體現在數據處理和場景應用兩個方面。

在數據處理方面,結合多年的數據挖掘經驗,洞見科技正在讓數據的預處理更加自動化和智能化,從而提高數據在隱私計算環節的計算效率。

在場景應用方面,洞見科技將隱私計算技術與其他金融科技進行了深度融合。

再次看市場推廣。洞見科技的市場推廣策略也是與對場景的服務相配合的。

為了以更少的人力投入觸達更多的金融機構,不少隱私計算廠商會依靠合作夥伴來進行部分市場推廣。這些合作夥伴大多是與金融機構此前有業務合作的公司,比如金融IT服務商等。

洞見科技的做法則完全不同。除了少數政企客戶之外,大多數情況下,洞見科技都會依靠自己的市場人員與客戶直接接觸。這樣做是因為,在金融機構購買洞見科技的隱私計算軟體之後,洞見科技後續要通過這個軟體平台,為金融機構提供智能風控、智能營銷、反洗錢、資產風險掃描等方面的服務。洞見科技需要與客戶直接接觸,深入了解客戶的業務,幫助客戶解決問題。

2.3 隱私計算疊加數據運營

此類隱私計算公司,初期是從某一場景切入,但是其最終目標並非專註於場景服務,而是致力於打通數據流通鏈路,為數據流通提供平台服務。

藍象智聯是這一方向的典型代表。

藍象智聯首先進入的是金融行業。在金融機構一側,不少機構對如何應用互聯網大數據的能力還有待提升。藍象智聯會在業務開展過程中,幫助金融機構了解不同的數據源在金融業務中應當如何使用。在數據源一側,數據源機構掌握的數據維度非常多,但是數據源不做金融業務,也不知道金融機構需要哪些數據,藍象智聯也會幫助數據源對數據進行處理和封裝,使得雜亂無章的數據變成符合金融機構應用需求的標準化的數據資產。

這些行動的目標在於,打通數據交易的鏈路,使得數據源和數據使用方的需求能夠真正對接起來,數據在藍象智聯的平台上能夠被越來越多地應用,從而使得藍象智聯的系統吸引越來越多的數據源和數據使用方,成為一個真正的平台。

2.4 開放平台

致力於走向這一方向的公司,隱私計算只是其業務的一環,其整個商業體系還有其他更多的設計目標。隱私計算在整個設計體系當中,主要是幫助實現數據的安全交互。在此基礎之上,整個商業體系應用數據分析來實現其他的業務創新。

同盾科技是這一方向的典型代表。

同盾科技建立了可信AI生態平台的基礎設施——智邦平台(iBond)、開放互聯參考模型 (FIRM)、和天啟可信AI開放操作系統 (InceptionAI)。

智邦平台(iBond),是可以幫助數據源和數據使用方之間實現數據安全交互的一個平台。

開放互聯參考模型 (FIRM)是為了解決不同聯邦系統的互聯互通問題,以及在更大範圍內建立聯邦生態網路。其中,FLEX (Federated Learning EXchange)協議是一套標準化的聯邦協議,是可信AI的HTTPS,能夠合規安全使用數據而不改變數據的所有權。它是FIRM體系中數據交換層的一種實現範例。

天啟可信AI開放操作系統,不僅可以實現用戶和各種傳統硬體資源之間的交互,更可以管理知識聯邦中各種任務聯盟進程和安全合規的虛擬大數據。

不同於許多提供隱私計算技術的廠商,同盾的天啟可信AI開放操作系統面向實際應用,提供數據、演算法、模型及應用商店。所有隱私計算的開發者、使用者,都可以在這個平台上安全交流和交易數據、演算法、模型、應用。

這樣一套基礎設施的建設,其主要目標是面向下一代人工智慧,建立可信AI生態平台,彙集數據、演算法、模型和各種應用,一方面推動人工智慧技術的進步,另一方面利用應用人工智慧技術來推動更多的創新。

同盾科技的案例,我們還將在第六章中作為代表案例詳細介紹。

2.5 「區塊鏈+隱私計算」基礎平台

這是零壹財經在調研中發現的全新的業務方向。這一方向的典型代表是微眾銀行的WeDPR平台和Oasis Network。

WeDPR是將區塊鏈技術與隱私計算技術結合起來建立的平台。它使得實際商業場景中的敏感數據在區塊鏈上可以得到更好的隱私保護。

具體來說,WeDPR是一套場景式隱私保護高效技術解決方案,依託區塊鏈等分散式可信智能賬本技術,融合學術界、產業界隱私保護的前沿成果,兼顧用戶體驗和監管治理,針對隱私保護核心應用場景提供極致優化的技術方案,同時實現了公開可驗證的隱私保護效果。

WeDPR由微眾銀行自主研發,致力於使用技術手段有效落實用戶數據和商業數據的隱私保護,提供即時可用的開發集成體驗,助力全行業合法合規地開拓基於隱私數據的核心價值互聯和新興商業探索,同時讓數據控制權真正回歸數據屬主。

WeDPR為「區塊鏈+隱私計算」的融合發展探索出新路徑,助力落地更多的應用場景,可應用於支付、供應鏈金融、跨境金融、投票、選舉、榜單、競拍、招標、搖號、抽檢、審計、隱私數據聚合分析、數字化身份、數字化資質憑證、智慧城市、智慧醫療等廣泛業務場景。

場景式隱私保護解決方案WeDPR由微眾銀行區塊鏈團隊基於多年在技術領域的沉澱而研發。該團隊自2015年開展聯盟鏈領域技術研究和應用實踐以來,已研發一整套含括底層技術、中間件、分散式數字身份、數據隱私保護、跨鏈、消息協作、數據治理等在內的技術方案支撐產業應用,實現全方位國產化,公開專利申請數位居全球前列,參與制定國際國內多項標準,牽頭建成最大最活躍的國產開源聯盟鏈生態圈,生態圈內彙集4萬餘名社區用戶、2000多家企業及機構共建區塊鏈產業生態,數百應用項目基於FISCO BCOS研發,其中超120個應用已在生產環境中穩定運行。同時,開源極大地推動了行業落地應用的發展。

圖:微眾銀行WeDPR應用場景矩陣

來源:微眾銀行

Oasis Network於 2020 年 11 月 19 日正式上線,是全球首個具有隱私保護功能和可拓展性的去中心化區塊鏈網路。

技術創新方面,Oasis 網路採用獨特的分層網路架構,將區塊鏈分為共識層和 Paratime 層,實現更高的性能和更強的可定製性,進一步解鎖區塊鏈的新用例和應用程序。

共識層由去中心化驗證節點組成,具有可拓展、高吞吐量、安全等特點;

ParaTime是智能合約層,託管許多ParaTime,每個運行時代表具有共享狀態的複製計算環境,用戶可根據自身需求進行復自定義創建。

在隱私保護方面,Oasis採用了英特爾的SGX擴展指令集「TEE可信執行環境」實現隱私保護,數據進入TEE安全「黑盒子」「黑盒子」後會進行加密處理,輸出結果為加密處理后的數據,任何沒有許可權的人甚至底層操作系統本身都不能非法調用,整個過程保護了數據隱私性,確保敏感數據不會泄露給計算節點或軟體開發者。

與此同時,Oasis 網路還創新提出了「數據代幣化」概念,用戶不僅能夠完全掌握自己的隱私數據,還能通過共享隱私數據獲得收益,進一步實現隱私保護,推動構建有責數據經濟。

隱私計算投融資與專利分析

(一)隱私計算投融資分析[本報告對於未披露具體金額的融資處理方式為:未透露=0,數十萬=50萬,數/近百萬=100萬,數/近千萬=1000萬,數/近億/億元及以上億,數十億億;為了方便統計,在進行貨幣換算時,本報告按1美元=6.5元來計算。]

隨著數字技術的飛速發展,新平台、新模式、新演算法不斷出現,數據安全的重要性日益凸顯,需求與政策的驅動也吸引了眾多風險資本的湧入。

2016年前後,隱私計算領域初創公司開始迎來風險資本的投資,至2021年9月累計融資規模超過56億元。

考慮到互聯網巨頭、第四範式、醫渡雲、聯易融等較為成熟的公司在融資之後僅將部分資金用於隱私計算產品研發和推廣,前述融資規模應在數百億元級別。下文僅以零壹財經目前已知的隱私計算初創公司以及隱私計算業務佔比較大的公司為統計對象,做一些維度的分析。

1、融資數量節節攀升,融資金額在2018年達到峰值

據零壹智庫不完全統計,截至2021年9月底,隱私計算初創公司累計獲得63筆股權融資,公開披露的融資總額達到56.1億元(12筆未透露金額)。近年來,隱私計算領域融資活躍度整體向好,融資規模受少數公司影響波動較大。

從數量上看,2013—2015年僅有同盾科技和星環科技2家公司獲得零星的投資[ 這裡需要補充說明的是:目前進入隱私計算領域的公司,有些在初創之時業務方向並非隱私計算,而是在2018、2019年之後逐漸涉足隱私計算業務,但是在數據統計當中,難以完全剔除此類數據進行統計,因此,他們最初獲得融資的時間會比進入隱私計算領域的時間更早。同盾科技初創時的業務方向更偏向金融科技,星環科技初創時的業務方向更傾向大數據。再例如,趣鏈科技最初的業務方向為區塊鏈,因此其融資金額並非全部投向隱私計算。];2016—2018年開始增多,每年達到5~6筆,2019年後攀升到12筆以上。從金額上看,每年波動較大,2016年開始超過5億元,2018年高達16.1億元創下年度最高融資記錄,2019年回落到13.5億元左右,2020年則不足3億元。究其原因,主要是少數明星公司獲得較大數額融資:2018年,趣鏈科技在獲得15億元B輪融資;2019年,星環科技獲得6億元D輪系列融資,同盾科技獲得1.1億元D輪系列融資。

圖:2013-2021年隱私計算初創公司融資情況

數據來源:零壹智庫

註:*數據統計截至2021年9月30日,下同。

2、八成融資處於早期階段,4家公司完成C輪融資

整體而言,A輪及其之前的融資數量為40筆,公開披露的融資總額約為7.4億元;B輪融資11筆,對應的金額高達26.3億元。早期階段(B輪及其以前)的融資數量佔81.0%,大多數企業尚未形成成熟的商業模式。C輪和D輪融資各4筆,融資總額分別為9.1億元和13.2億元。

圖:2013—2021年隱私計算初創公司各融資階段數量及金額分佈

數據來源:零壹智庫

註:A輪包含Pre-A、A、A+,其他同理,戰略投資均發生在種子/天使輪或Pre-A輪后;下同。

從時間維度上看,2017年有2家隱私計算公司進入C輪融資階段:星環科技和同盾科技,它們在2019年又各自完成了2輪D系列融資。時隔近四年,趣鏈科技和富數科技相繼在2021年完成數億元C輪融資。早期融資持續活躍,中後期融資陸續出現。

圖:2013—2021年隱私計算初創公司各融資階段數量走勢

數據來源:零壹智庫

3、隱私計算公司聚集在北上杭,杭州和上海發展更為成熟

獲投隱私計算初創公司的註冊地主要在北京、上海和杭州3個城市,其次是深圳和西安。北京有7家公司獲得融資,但融資總額僅0.5億元;上海有7家公司獲得20輪融資,杭州有6家公司獲得19輪融資,二者融資總額分別為18.3億元和34.3億元。杭州互聯網基因強大,同盾科技、趣鏈科技等數據服務類公司起步早、發展快,整體發展更為成熟。

圖:各地隱私計算初創公司融資數量及金額分佈

數據來源:零壹智庫

4、IDG資本和啟明創投投資最多

從投資機構來看,IDG資本投資次數最多,達到6次,但只投了同盾科技和衝量在線;啟明創投投資5次,投了星環科技、同盾科技和鍩崴科技;基石資本投資4次,也只投了2家公司:星環科技和星雲Clustar。投資達到3次的有紅杉資本、華創資本、寬頻資本等6家機構,詳見表1所示。

此外,騰訊領投了星環科技2.35億元C輪融資,上市公司新湖中寶旗下智腦投資在趣鏈科技15億元B輪融資中投入約12.3億元。

表:隱私計算領域活躍投資機構(投資次數>=3)

數據來源:零壹智庫

表:隱私計算初創公司融資記錄(金額>=1億元)

數據來源:零壹智庫

(二)隱私計算專利分析

隱私計算作為一個新興的技術領域,目前初創公司居多。即使在發展較為成熟的互聯網巨頭和上市公司當中,隱私計算也是新的業務板塊。因此,可用于衡量一家公司技術實力強弱的公開可用的數據較少。

在目前的狀況下,專利數據是可衡量一家公司實力的有力參照系。因此,零壹智庫對隱私計算的專利數據進行了專門的分析。

根據零壹智庫專利數據統計結果顯示,截至2021年10月1日,全球有28個國家和地區、3000家公司參與了隱私計算相關專利的申請,合計1.72萬件。

從專利申請情況來看,目前中國隱私計算技術領先美日韓等其他國家,在全球TOP50企業中,中國有23家公司進入榜單。其中螞蟻集團和華為分別位列全球第1和第3。

從技術方案來看,申請可信執行環境專利的公司數量遠高於多方安全計算和聯邦學習。

從行業應用情況來看,隱私計算技術正不斷滲透各個行業和場景,除了在金融、醫療、政務等常見場景,一些公司還探索隱私計算技術在電網、審計、出行、酒店、民航、招聘等場景中的應用。

中國目前有超過2000家公司參與隱私計算專利申請,但是成功推出相關產品的僅部分公司。在相關政策和行業法規的推動下,未來可能有更多的隱私計算產品被推出。

1、國內外隱私計算專利申請情況

早在20世紀80年代,以MPC為代表的密碼學理論就已經被提出,長期以來處於實驗室研究階段。根據零壹智庫專利數據顯示,隱私計算相關專利首次於1986年由英國的電信公司Plessey提出申請。

之後的30多年,來自中、美、日、韓、法等28個國家和地區的公司相繼開展了對隱私計算技術的研究,並參與了專利申請。截至2021年10月1日,全球有2,966家公司參與了隱私計算相關專利申請,合計17,170件。

其中,中國、美國和日本是隱私計算專利申請數量最多的3個國家,專利申請數量分別是8784件、4151件和1298件,佔比分別為61.16%、24.18%和7.56%。

圖: 全球隱私計算專利分佈情況

數據來源:零壹智庫,智慧芽

2、中國隱私計算專利申請情況

截至2021年8月,中國已經有超過2,000家公司參與了隱私計算專利申請,合計8784件。

縱觀中國在隱私計算領域的專利申請情況,大致可以分為3個階段。

階段一(2011年之前),中國每年申請的隱私計算專利不超過100件,每年參與專利申請的公司不超過60家。在這個階段,雖然隱私計算相關概念還未提出,但是相關密碼學技術已經出現。

階段二(2012~2015年),中國每年隱私計算專利申請數量超過100件,參與專利申請的公司數量也開始突破100家。

階段三(2015~至今),中國每年隱私計算專利申請數量呈現爆髮式增長,在2019~2020年每年專利申請數量保持在1,000件以上,參與公司規模也均在400家左右。

儘管中國在隱私計算領域的研究晚於美國等發達國家,但在政府相關政策的加持和企業及個人對隱私安全的愈加重視,中國隱私計算技術在近兩年獲得快速發展,並在全球已初具競爭優勢。

圖:2001~2021H1中國隱私計算專利申請情況

數據來源:零壹智庫,智慧芽

3、中國隱私計算技術應用情況

目前,隱私計算核心技術主要包括聯邦學習、可信執行環境和多方安全計算。

由於可信執行環境具有通用性高、開發難度低、演算法實現上更加靈活等特點,該技術專利申請受到眾多科技公司的青睞,數量明顯高於其它兩個。根據零壹智庫專利數據統計,截至2021年10月,中國有181家公司申請了相關專利,合計815件,是隱私計算領域公司參與度最高、專利申請數量最多的技術。其次,聯邦學習和多方安全計算,參與專利申請的公司分別有108家和105家,專利申請數量分別為396件和416件。

圖: 中國隱私計算各技術領域專利申請情況

數據來源:零壹智庫,智慧芽

從專利申請情況來看,同態加密和零知識證明在中國關注度明顯高於其他加密技術。截至目前,同態加密有182家公司參與相關專利申請,專利合計544件;其次是零知識證明,有124家公司參與專利申請,專利合計376件;其他4項密碼學技術參與公司數量均在10~50家公司之間,專利申請數量在20~110之間。

圖:密碼學在隱私計算領域應用情況

數據來源:零壹智庫,智慧芽

4、中國隱私計算行業及場景應用

在近幾年,隱私計算技術和產品逐漸成熟,伴隨著中國數字經濟的發展,數據安全和個人隱私安全受到政府、企業及個人的關注,除互聯網科技公司之外,金融機構、醫療、電信、電網、大消費等多個行業公司相繼探索隱私計算的應用。

從專利申請情況來看,隱私計算主要應用場景有金融、醫療、電網、政務等多個行業。

4.1 金融+隱私計算

從專利申請情況來看,金融行業是隱私計算技術專利申請數量最多、參與公司規模最大的行業。截至目前,中國有129家公司申請了相關專利,合計408件。在這些公司當中,專利申請數量最多的3家公司分別是螞蟻集團、阿里巴巴和平安集團。除此之外,金融機構當中建設銀行、平安集團、陽光保險、泰康保險、中國銀聯、興業證券等金融機構均有相關專利申請。

表: 2021年中國金融機構申請隱私計算專利情況

數據來源:零壹智庫,智慧芽

註:數據截至2021年10月1日公開的專利數量

從應用場景來看,隱私計算技術在金融行業中的應用場景包括供應鏈金融、資產管理、保險理賠、風險管理、反洗錢、金融身份認證、徵信評估、財務審計等。

4.2 醫療+隱私計算

醫療行業,醫學研究、臨床診斷、醫療服務等對數據分析和應用挖掘有著強烈需求。但是,現階段醫療大數據搜索、共享、數據挖掘服務尚處於不成熟階段,缺乏對數據的深度可信挖掘和許可權認證,尚未形成有體系的標準和保護措施。嚴格的法律,缺失的保護體系和標準,造成大量醫院,醫療研究機構等醫療數據擁有者不願或不敢分享其擁有的數據資源,從而嚴重影響了醫療數字化的進步和發展。

為此,一些科技公司採用隱私計算技術構建相關係統或平台,各節點的醫療機構在不需要共享原始數據的情況下進行聯合建模和聯合數據分析,有效推動醫療行業數據高效利用。

據零壹智庫不完全統計,截止目前,中國有41家公司申請了隱私計算+醫療相關專利,並且這些公司專利申請數量保持在1~3件。在這些公司當中,騰訊、榮澤科技、醫渡雲等公司均有推出自己的隱私計算產品。

4.3 電網+隱私計算

目前,我國經濟和網路科技的飛速發展,我國對電力系統各方面的需求在不斷提高,智能化進程也在不斷推進。與此同時,智能電網的安全問題也日益得到重視。其中,裝備在電網中的各種感測器和智能電錶負責實時監測電網的運行狀態和收集用戶用電數據,並將這些信息及時地提交給控制中心處理。但目前的大多數智能電錶都是以明文的形式與控制中心進行交互,數據的安全性並未得到應有的保障,用戶的隱私信息容易被泄露。

為此,一些企業在近幾年開始探索隱私計算技術在智能電網中的應用。根據零壹智庫專利數據統計,截至目前,我國有30家公司申請了電網+隱私計算相關專利。其中,專利申請數量最多的兩家公司分別是國家電網和南方電網,專利申請數量分別是31件和16件,其餘28家公司專利申請數量保持在1~3件之間。

除此之外,根據專利申請情況,隱私計算應用場景還包括出行、智能汽車、酒店、民航、招聘等。很顯然,各行業對於隱私計算技術均有不同程度的需求,但是大部分場景處於研發階段,未來發展還需更多投入。

5、全球隱私計算專利榜單TOP50

根據專利申請數量,零壹智庫發布了2021年全球隱私計算專利榜單TOP50。其中,專利申請數量最多的3家公司分別是螞蟻集團(1,1857件)、Intel(780件)和華為(780件)。

按照公司註冊地,這50家公司分別來自中國、美國、日本、英國、韓國、芬蘭、荷蘭、瑞典、法國和德國10個國家。其中,中國數量最多,有23家公司進入榜單;其次是美國和日本,各有9家公司上榜。

表: 2021年全球隱私計算專利榜單TOP50

數據來源:零壹智庫,智慧芽

注1:專利數據通過隱私計算相關計算關鍵字和密碼學IPC專利分類號檢索獲取,數據結果可能會與實際情況存在差異

注2:數據截至2021年10月1日公開的專利數量

隱私計算在金融領域應用

金融領域,是當下隱私計算技術應用落地最為活躍的領域。

究其原因,是因為近年來金融科技的發展對金融業的發展形成了實質性影響,為隱私計算技術的落地打下了良好的基礎。

近十年來,通過應用雲計算、大數據、人工智慧、區塊鏈技術,面向個人和小微企業的零售金融正逐漸成長為商業銀行的主流業務,同時金融業的基礎設施經歷了更為深刻的數字化、智能化升級換代。

在此基礎之上,應用隱私計算技術,能夠迅速為金融機構帶來效益的提升。這也使得金融機構有動力投入更多的預算來應用隱私計算技術。也是由於預算充足,金融領域成為大多數隱私計算技術應用落地的首選領域。

目前,金融領域是在早期Fintech1.0時代的金融電子化及Fintech2.0時代的互聯網金融的落地實施后,金融科技逐步步入Fintech3.0時代。Fintech3.0時代將以傳統金融科技化為核心方向,而Fintech3.0的重要特徵就是智能金融,數字化、智能化、開放化將是其核心要素。因此,數據資產將是智能金融建設的核心支柱。未來,如何充分實現數據價值挖掘釋放、避免出現數據鴻溝及信息孤島、完善數據應用的隱私保護,將是智能金融的重要議題,隱私計算將是實現上述目標的重要技術支撐。

(一)隱私計算在金融領域應用的開端

在中國,金融領域對隱私計算的應用,最早是從以螞蟻集團和微眾銀行為代表的一批金融科技領域的先行者開始的。

最早是2016年,從螞蟻集團開始。根據公開資料[ 《螞蟻金服共享智能實踐》,來源於知乎號「螞蟻共享智能」,https://zhuanlan.zhihu.com/p/146954520。原文首發於期刊《中國計算機學會通訊》(CCCF)2020年第5期。],為了更好地應對形勢的變化,解決數據共享的需求與隱私泄露和數據濫用之間的矛盾,螞蟻集團2016年提出了希望通過技術手段,在多方參與且各數據提供方與平台方互不信任的場景下,能夠聚合多方信息進行數據分析和機器學習,並確保各參與方的隱私不被泄漏,數據不被濫用,螞蟻集團當時稱之為「共享智能」。

螞蟻集團最初在可信執行環境(TEE)和多方安全計算(MPC)兩個方向進行探索。在實踐中,螞蟻集團逐漸發現,不同技術都有各自的優勢,同時在業務發展的不同階段用戶對隱私保護的需求是不同的。把不同的技術融合到一起,發揮各自技術的優勢,往往會達到一個更為理想的效果。因此,在實際的應用中,基於用戶的需求,螞蟻集團逐漸嘗試靈活應用多種技術提升實際應用效果。

此後,在不同的應用場景中都逐漸出現對隱私計算的需求和思考。

區塊鏈技術的探索和應用,也引發了對隱私計算的需求和思考。2017年7月31日,深圳前海微眾銀行股份有限公司、上海萬向區塊鏈股份公司、矩陣元技術(深圳)有限公司聯合宣布,將區塊鏈底層平台BCOS(取Be Credible, Open & Secure涵義命名)完全開源,致力於打造一個深度互信的多方合作共同體,進一步推動分散式商業生態系統的形成。之後,三家都在這個聯盟鏈技術的基礎上做了大量應用,在生產環境中不斷驗證區塊鏈應用。

萬向區塊鏈董事長肖風曾在公開演講中介紹,BCOS開源之後,其對隱私計算也日漸關注。因為區塊鏈除了性能、安全性、互操作性、易用性等技術尚未成熟之外,另外一個十分重要的課題就是:區塊鏈應該帶來的是隱私保護之下的數據共享。因此, 2017年開始,萬向便著手準備隱私計算方面的工作。[《萬向肖風:隱私計算是世界級的話題》,2018年12月5日,來源於矩陣元官方微信公眾號。]

與此同時,2018年微眾銀行人工智慧團隊也開始關注到隱私計算技術。[ 《對金融領域而言,聯邦學習的實際價值是如何體現的?》,來源於InfoQ訪談,載於FATE開源社區微信公眾號。]2018年,在業務實踐和行業觀察中,微眾銀行人工智慧團隊發現訓練AI所需要的大數據實際上很難獲得,數據的控制權分散在不同機構、不同部門,「數據孤島」問題嚴重,加之政策法規對數據隱私和數據安全的要求讓數據共享和合作更加困難。

針對實際的業務痛點,他們發現聯邦學習是一種行之有效的解決方案,並開始進行研究和探索。從2018年到2019年初,微眾銀行發表了多篇聯邦學習相關論文,對於聯邦學習的概念、分類、基本原理等基礎理論進行系統性研究。同時,2018年起,微眾銀行人工智慧團隊基於聯邦學習理論研究進行相關開源軟體研發。經過探索,微眾銀行搭建起了理論研究、工具軟體、技術標準、行業應用的多層級聯邦學習生態框架,並且開始有騰訊、華為、京東、平安等生態合作夥伴加入。

2019年初,微眾銀行正式開源全球首個工業級聯邦學習框架FATE(Federated Learning Enabler),並開始嘗試將聯邦學習應用於金融業務中。FATE的開源,使得聯邦學習的應用門檻大幅降低。2020年初,針對金融應用中聯合風控、匿蹤查詢等業務需求,微眾銀行進一步給出了場景式隱私保護解決方案WeDPR,並基於WeDPR在2021年5月發布多方大數據隱私計算平台WeDPR-PPC。WeDPR方案組合了多種隱私保護策略,融合安全多方計算、同態加密、零知識證明、選擇性披露等演算法,滿足多變業務流程。

(二)創業公司湧現

在金融科技巨頭進行隱私計算探索之時,隱私計算創業公司也開始湧現。

2017年至2019年間,最早進入隱私計算領域的創業公司有矩陣元、翼方健數、零知識科技、華控清交、富數科技、同盾科技、星雲Clustar、天冕科技、零知識科技、數牘科技、融數聯智、鍩崴科技等公司。2020年之後,隱私計算領域創業公司數量越來越多,洞見科技、光之樹、藍象智聯、衝量在線等越來越多的創業公司湧現。(註:以上公司按照進入隱私計算領域時間先後順序排名)

表:進入隱私計算領域的創業公司情況

數據來源:零壹智庫

這些創業公司背景各異,但都是基於各自的業務看到了市場需求,或者憑藉所掌握的技術進入了隱私計算領域。

(三)隱私計算落地金融機構

2021年,隱私計算技術開始在金融機構落地。

1、工商銀行[ 《聯邦學習在工行的實踐》,https://www.163.com/dy/article/GC04ACG4055219FH.html。]

據零壹智庫調研了解,工商銀行已經開始探索聯邦學習技術在金融業務中的應用。

目前,在聯邦學習方面,工商銀行主要在推進以下三方面的工作:

第一,構建聯邦學習技術能力。首先,通過引進成熟產品、完成工商銀行聯邦學習技術平台的建設。適配工商銀行PaaS 平台,並與行內現有模型運營、監控管理組件融合。同時,引入FATE開源技術,並加入FATE TSC,打造聯邦學習場景建設專業團隊。

第二,試點聯邦學習業務場景。目前,主要是在數據和模型驅動力強、有對外合作需求的信貸、風控等關鍵業務領域上,逐步試點聯邦學習技術在業務場景上的實踐應用。

第三,推進聯邦學習生態建設。主要是聯合制定金融業聯邦學習標準,推進建立聯邦學習對外合作的常態化機制和聯合場景合作建設模式。

目前,工商銀行的聯邦學習已應用於多個場景。比如引入北京金控的不動產數據,與行內貸款企業的時點貸款餘額、註冊資本、賬戶餘額等數據聯合建立企業貸中預警監測模型,此聯邦模型提升准召率約4%,從而提升了工商銀行風險監測業務能力。另外,工商銀行也通過聯邦學習與互聯網公司的客戶特徵數據完成了聯合建模,並將信用卡申請反欺詐模型的K-S值提升了25.1%。此外,工商銀行還基於聯邦學習在保險營銷場景中的應用打造相應的聯邦建模方案,通過驗證聯邦遷移技術挖掘集團的潛在客戶實現集團客戶向子公司的導流。

圖:工商銀行北京分行探索應用聯邦學習技術案例

資料來源:工商銀行

未來,工商銀行在探索聯邦學習應用方面有兩方面的計劃:

第一,進行開源技術研究。工商銀行計劃在行內搭建FATE平台,驗證開源技術對億級數據的支持能力。同時,利用開源FATE平台推進行內實際業務建模場景的測試驗證,對其核心演算法分別從論文、源碼進行分析,完成推進圖聯邦相關場景的驗證落地。

第二,計劃將聯邦學習技術應用於更多的場景。

首先,是智能風控場景。引入政務、運營商、企業等多數據源,共同完成風控數據分析、風控模型訓練和風險決策的任務,以節約信貸審核成本,提升信貸風控能力。

其次,是智能營銷場景。融合集團內子公司之間、以及行外數據,在「獲客-促活-留存-轉化-挽留」等核心運營環節實現多維度精準獲客、數據化畫像分析。

再次,是反洗錢場景。在不泄露各自樣本的前提下,充分利用多家合作方的反洗錢樣本,建立訓練效果更好、更穩健的聯邦反洗錢模型,降低罰款和聲譽受損等業務風險。

2、交通銀行

2020年12月15日,上海富數科技有限公司與交通銀行總行正式簽署技術服務合同,富數科技將成為交通銀行金融科技戰略合作夥伴。雙方將聯手建設具有交行特色的多方安全計算系統平台、積极參与行業技術標準論證和修訂,解決金融大數據內外融合協作中的隱私保護和數據安全問題,為普惠金融、數字金融等業務場景提供安全可控的聯合建模、聯合計算和聯合查詢統計。

3、招商銀行

到目前為止,零壹智庫得知的招商銀行在隱私計算方面的探索,主要集中在落地的產品上。

例如,2021年5月11日,招商銀行深圳分行發布「深信貸」產品,這也是招商銀行首個運用聯邦學習技術的貸款產品。「深信貸」是深圳市場監督管理局和招商銀行深圳分行專門面向小企業推出的融資產品,旨在運用信用信息促進解決小企業融資難、融資貴難題。企業只要符合「三有」條件,即「有誠信、有經驗、有納稅」,就可以在招商銀行官網、深圳信用網等線上渠道申請深信貸。這款產品的風險控制,是由招商銀行深圳分行與深圳市公共信用中心對接系統和模型數據來做的,聯邦學習技術可在招商銀行深圳分行和深圳市公共信用中心部署子模型,無需各數據方披露底層數據即可進行聯合運算。

4、光大銀行

2021年8月,光大銀行成為國內金融業首個把企業級數據流通基礎設施平台 — 多方安全計算平台投入生產使用的銀行,積極探索數據安全流通與融合應用的新實踐。

該平台由華控清交承建。基於隱匿查詢、聯合統計、聯合建模等平台功能。光大銀行多方安全計算平台可以有效推動集團內數據、行內數據、以及外部企業數據的安全融合,解決上述過程中明文數據獲取困難、數據保護困難和數據使用合規困難等棘手問題。

應用方面,平台可以用於聯合營銷、聯合風控、統一授信、業務合規等多領域,如幫助光大銀行與合作機構開展多方數據安全聯合建模,提升精準營銷能力;在不暴露客戶信息的情況下進行聯合統計,開展客戶綜合管理;在保護銀行查詢意圖和客戶信息安全的情況下,向數據服務方查詢數據,獲得匹配結果等。

5、平安銀行

平安科技的蜂巢聯邦智能平台。它由平安科技聯邦學習技術團隊完全自主研發,圍繞聯邦學習、聯邦數據部落、聯邦推理、聯邦激勵機製為核心而建設的聯邦智能生態體系,是數據隱私安全保護的商用級解決方案,幫助解決當下數據難題與隱私保護。

蜂巢聯邦智能平台的核心是保證參與各方的原始數據始終不出本地,通過傳輸模型的梯度和參數的聚合計算來進行共享模型的訓練和迭代,可以大幅度優化模型效果。它允許從跨數據所有者分佈的數據中構建集合模型,可被廣泛應用於各種領域,具有安全性、隱私性、合法性的特點,這樣既兼顧了AI的訓練也避免了數據泄露的風險。

與此同時,平安銀行還與京東金融雲進行合作探索。雙方聯合開發出跨平台聯邦建模數據合作安全保護方案,應用於不同聯邦學習平台之間的實時通信。雙方基於聯邦學習技術進行聯合開發和方案部署,在平安銀行的汽車金融業務的場景實踐中,兩方數據特徵無需出庫的前提下,較單方模型效果提升30%以上。

(四)隱私計算在金融營銷領域應用

在金融營銷場景中,隱私計算技術主要被用來合規調用更多的金融機構外部數據,從而將內外部數據結合起來,做更精準的營銷,提升轉化率,這可以幫助金融機構大大節省獲客成本。目前,實踐中已經積累了不少案例。

1、星雲Clustar在某大型股份制銀行的營銷項目案例

某大型股份制銀行在其個人信貸營銷業務中,希望達到降低信貸風險的同時合理分配營銷資源的目的,為客戶提供精準信貸服務,並提高客戶的產品體驗。

星雲Clustar依託海量安全可信的數據源為該行搭建了聯邦學習模型,並根據該演算法模型為客戶評級打分,由此合理分配營銷資源,使該行個人信貸業務的當月營銷轉化率達3.5倍以上,聯邦模型AUC達到0.73,極大地提高了營銷精準率和客戶轉化率。

2、天冕科技助力互金公司提升營銷效果案例

在營銷場景案例上,天冕科技助力某頭部互金公司提升營銷效果,因為其存在單獨使用現存自有數據特徵或者對方評分只能達到收支平衡,而且使用線下聯合建模方式容易泄露用戶數據的風險。在使用聯邦學習方式進行聯合建模之後,應用所得模型對已註冊但未曾進件的老客戶進行綜合評分,對前10%評分高的用戶營銷后,模型KS提升11%,每期營銷收入增加65萬。

圖:天冕科技助力某頭部互金公司聯合營銷案例

資料來源:天冕科技、零壹智庫

(五)隱私計算在風控領域應用

在金融風控場景中,基於同樣的原理,由於可以應用隱私計算技術將金融機構內部和外部的數據聯合起來進行價值挖掘,金融機構就可以更好地識別風險,從而提升風險控制的效果,降低風險、提升收益。

1、天冕科技與金融機構聯合風控案例

目前,在用戶側,天冕科技已經與10多家金融機構建立了合作,合作的內容主要是聯合數據提供方,在各方數據不出私域的情況下,進行聯合風控建模和聯合營銷。

比如,在風控場景上,WeLab匯立集團採用線上聯邦學習系統,篩選了多家數據徵信公司相關性較高的特徵,進行聯合建模,建立一個泛化能力更強的模型,取得了更好的效果。KS提高5%,壞賬有所下降。

圖:天冕科技聯合風控案例圖

資料來源:天冕科技、零壹智庫

在場景應用中,天冕科技的顯著優勢在於場景經驗豐富。比如,在金融風控場景中,隱私計算技術的提供商首先需要讓金融機構合作夥伴知道,哪些數據和演算法對業務是最有用的。此外,在應用方面還有很多操作細節,比如在數據方面,不僅需要知道哪些類型的數據最有用,還需要知道哪些數據提供商的數據最好用,這些數據應該用在什麼地方。這是需要用長時間的實踐和教訓才能換來的經驗。豐富的場景經驗,可以讓合作夥伴將時間和資金投入最能提升業務效果的方向,從而真正讓業務跑起來,見到實效。

2、瑞萊智慧應用隱私計算幫助銀行提升反欺詐效果案例

(1)業務背景

近年來,基於機器學習的大數據反欺詐風控技術迅猛發展,大部分銀行均構建了交易實時反欺詐系統,通過結合專家規則與機器學習模型來甄別欺詐交易與行為。但隨著黑產行業的智能化與集團化,跨行業欺詐逐漸成為常態,單次欺詐行為貫穿社交媒體、銀行多個環節,各機構基於自身數據無法應對,例如在社交欺詐場景中,社交企業掌握黑客針對用戶的撒網、信任欺詐等行為的特徵,銀行側掌握受害者向黑客轉賬以及後續資金轉移等特徵,但兩方的特徵數據均不足以對欺詐行為進行有效識別。

在此背景下,如何在有效保護數據隱私的前提下,幫助企業合法合規地利用內外部數據,豐富樣本數據特徵維度,構建更加精準的反欺詐風控模型,提升反欺詐能力,是當前各類銀行機構亟待解決的問題。

(2)解決方案

為了應對以上痛點,瑞萊智慧提供了「數據+平台+模型」的一體化隱私計算解決方案,幫助銀行安全合規的實現與外部機構的跨行業數據鏈接,基於金融特徵、交易特徵、行為特徵和干係人特徵等信息構建反欺詐模型,實現更精準有效的欺詐甄別。

具體實施中,銀行方通過部署RealSecure平台節點,快速接入包括運營商、設備、支付類數據等在內的多類外部數據源,極大的豐富了樣本特徵維度。同時通過縱向聯邦的方式,基於行方準備的反欺詐樣本數據,首先通過RealSecure的PSI功能(不同企業之間持有各自集合的兩方來共同計算兩個集合的交集運算,在協議交互的最後,一方或雙方得到正確的交集數據,而不在交集里的一方數據,另一方無法得到任何信息,這樣就保證了雙方的數據安全)與外部數據源進行隱私求交,獲取多方的交集客戶信息,在銀行客戶三要素信息不出庫的同時,完成銀行與數據源之間的樣本對齊。然後,運用RealSecure提供特徵工程與模型訓練模塊,完成反欺詐模型訓練與調優工作。

圖:RealSecure平台縱向聯邦示意圖

(3)方案效果

效果方面,該方案幫助銀行安全合規地引入支付行為、設備信息、社交習慣等多類外部數據,大幅提升了模型的準確性和效率,隱私計算模式下構建的反欺詐模型AUC可達到0.82,KS達到0.48,效果較大提升。

同時基於編譯器引擎,隱私保護演算法構造速度指數級提升,系統整體運行速度達到業內典型架構模式的20~40倍,在實施難度、系統效率、安全可視等方面滿足工程、業務、運維、安全等各方面綜合需求,具備成熟的商用推廣模式。

3、金智塔科技在小微、科創企業授信方面取得突破

2015年前後開始,金融科技領域的應用更多集中於面向個人消費者的消費金融應用,在小微金融方面的嘗試從2019年起剛剛起步,現在仍在探索階段。目前,應用隱私計算技術,金智塔科技在小微金融的風控方面目前已經開始取得突破。

在數據隱私保護的背景下,銀行對科技型中小企業的信貸支持工作受到挑戰。與大型企業相比,中小微企業往往規模小、資金少,尤其是科創型企業,其「重智力、輕資產」的特點使得抵押資產較少,因此,銀行對科技型中小企業授信必須得到更多維度的數據支持。政府數據、企業數據成為授信業務最可靠的數據補充,然而行政部門雖然存儲了豐富的企業數據,但基於隱私保護的要求,無法將原始數據對銀行輸出,信貸支持工作面臨困局。

以杭州市某區域內小微、科創企業特點痛點為例,區內存續企業122940家,其中小微企業10萬餘家,科創企業6000餘家,大量企業均面臨金融服務困境。困境主要由以下原因造成:第一,企業財務不規範、信息分散,銀行不能直接通過數據獲取企業真實經營情況,致使貸款申請難;第二,企業資金少、凈資產不足、規模小,企業基於生產需要申請貸款,銀行主要以企業凈資產來進行授信,致使貸款額度滿足難;第三,科創企業重智力,輕資產;經營團隊學歷高能力強,擁有多項專利,銀行缺少評估方法和手段,致使有效資產評估難;第四,企業抵押資產較少,銀行發放貸款需要擔保,致使貸款擔保難。

針對域內小微企業以及小微企業融資產品的發展實際,某商業銀行基於「金智塔隱私計算平台」,融合政府部門開放數據、行內數據、第三方商業數據,通過聯邦學習與多方安全計算解決數據孤島和用戶隱私保護難題,研發了面向全域小微、科創企業的在線智能授信解決方案。該方案基於多方數據,實現企業智能分類;通過數據驅動,實現在線、多維度建模,智能化授信;優化信貸流程,貸款線上一鍵申請,線下便捷用信,有效解決小微、科創企業貸款申請難、資產評估難、額度滿足難等問題,並提升企業貸款可獲得性和便利性。

圖:金智塔隱私計算平台智能授信應用場景示例

在該智能授信項目實踐中,基於「金智塔隱私計算平台」的聯合智能授信方案設立准入評估、成長力評估、風險評估、授信額度估算等各類模型。小規模納稅人授信模型以企業實際應稅銷售額、實有凈資產和納稅額為基礎,結合行業特點,充分考慮企業發展需求,合理配置參數,實現對小規模納稅人的在線智能授信。一般納稅人授信模型則以企業實際應稅銷售額、實有凈資產和納稅額為基礎,結合企業流動資產周轉率、資產負債率等指標,合理配置參數,實現對一般納稅人企業的在線智能授信。

為解決對科創企業重智少資的授信難題,國內各銀行處於起步探索階段等問題,金智塔自主研發了以企業生命周期模型、企業成長力模型、知識產權估價模型為核心的授信模型,實現數據驅動的科創企業智能授信。

圖:金智塔科技數據驅動的科創企業智能授信模型

在功能完善的基礎上金智塔聯合智能授信平台展示出四大特色:全域、數字、智能、便捷。全域是指覆蓋所有的小微和科創企業,全面普惠;數字是指貸款申請及授信全流程採用線上化,數字驅動;智能是指利用大數據和人工智慧技術,實現智能決策;便捷是指線上一鍵申請、線下一次簽約、最多跑一次。

該平台通過試點小微及科創企業大數據智能授信服務場景,打通數據部門、銀保機構、第三方數據服務商等多家單位,完成小微及科創企業聯合授信、聯合風控及聯合營銷建模。實現科創企業成長力評估、中小企業風險評估、行業景氣指數、房產估值等多個應用,目前已覆蓋近20餘萬家企業數據,為企業實現智能在線授信、用戶便捷用信,授信額度提升百萬元,幫助企業降低50%以上融資成本,推動金融機構與企業數字經濟發展。2020年起在金融領域實踐中,在省有關部門指導框架下相繼完成多個銀行重大開發項目。

隱私計算金融應用典型案例

(一)同盾科技

在零壹智庫調研中接觸到的隱私計算廠商當中,同盾科技的理論和產品體系是最為系統的。

同盾科技的隱私計算戰略不僅僅聚焦於隱私計算的技術發展,而是構建面向下一代可信AI平台,提出了全新的理論體系,並且形成了系統的產品架構和技術生態。

1.1 同盾科技知識聯邦理論體系

同盾科技提出「知識聯邦」的框架體系,作為一個統一的、層次化的框架體系,它支持安全多方檢索、安全多方計算、安全多方學習(聯邦學習)、安全多方推理等技術方案。以層次化的方式,將隱私計算的幾個主要流派都融合在知識聯邦中。

知識聯邦是打造數據安全的人工智慧生態系統的基礎,也是未來通向下一代可信人工智慧的必由之路。2019年末,同盾科技發布《知識聯邦白皮書》,對知識聯邦的背景、定義、平台、挑戰、場景應用以及未來發展前景進行了全方位、全景式剖析。

圖:同盾科技知識聯邦理論體系示意圖

(1)知識聯邦的四大層次:

知識聯邦是一個國產原創、自主可控、國際領先的框架體系。知識聯邦的領先之處在於,它是面向下一代人工智慧技術發展的理論創新。現有的人工智慧技術主要是將數據聯合起來進行分析,而知識聯邦主張不僅將數據聯合起來進行分析,還要將更多的認知、知識聯合起來進行分析,從而推動人工智慧技術的進步。

在理論層面,知識聯邦包含四個層級:信息層、模型層、認知層和知識層。在每個層級中,聯邦的對象不同,應用目的也不相同。

信息層:主要發生在聯邦的數據轉到第三方的伺服器之前,需要先把所有數據加密,或通過某種形式轉換成為有價值的信息。信息層更多應用在聯邦計算的過程中,比如金融經常出現的多頭共債問題,比如A/B test,都可以在信息層完成。

模型層:發生在模型訓練過程中,跟之前提到的聯邦訓練的過程實際上是一致的。用本地數據訓練本地模型,把模型參數變化加密之後,傳送到第三方進行聚合。

認知層:也發生在模型訓練過程中,但並不把模型參數聚集在一起聯動,而是把局部訓練之後產生的粗淺認知進行聯邦,變得更合理。即在每一個參與方訓練本地的數據,提取本地的模型的特徵表達,加密之後上傳到第三方伺服器,實現集成。

知識層:前面形成很多認知結果之後,把它存成知識庫。這種知識庫其實每一家機構都有,能夠組成一個知識網路。如果在知識網路上不斷推理和演繹,挖掘出更有價值的知識,能提前預判事情的發生,最終形成合理決策。

(2)同盾科技知識聯邦技術特點

生態完備:擁有包括數據提供者,數據使用者,模型使用者,模型提供者,還有整體服務的提供者和服務使用者多個參與主體;擁有各種服務平台和生態:公有雲、私有雲、專有雲和本地部署。

高度開放性:為了把知識聯邦能夠最大化的普及和採納,採取全面開放的方式,並率先提出多項領先的開放性協議。

1.2 同盾知識聯邦產品體系

承載知識聯邦理論體系的商業化落地產品,就是同盾科技所建立的可信AI生態平台的基礎設施——智邦平台(iBond)、開放互聯參考模型(FIRM)和天啟可信AI開放操作系統(InceptionAI)。

1.2.1 工業級應用產品智邦平台(iBond)

智邦平台,能夠把數據要素方保護起來,安全地使用這些數據、能夠切斷數據的轉移,不需要原始數據的轉移、也不需要匯聚到科技公司或者互聯網巨頭。

在平台中同盾還實現了數據接入標準化和數據安全交換協議,可以讓數據提供者輕鬆地進行聯邦合作。

1.2.2 開放互聯參考模型(FIRM)

開放聯邦系統互聯參考模型,即FIRM (open Federated system Interconnection Reference Model),該系統分為五層:平台層、通信層、數據交換層、演算法層和應用層。

FIRM將每層的功能定義與實現細節區分開來,使它具有普遍的適應能力。理論上,FIRM中每一層都建立在它的下層之上,向它的上一層提供一定的服務,而把如何實現這一服務的細節對上一層加以屏蔽。為此,需要針對每一層定義標準化的協議規範,並在協議中詳細描述該層所提供的服務和動作,以保證提供有效的服務。

其中,FLEX (Federated Learning EXchange)協議是一套標準化的聯邦協議,是可信AI的HTTPS,能夠合規安全使用數據而不改變數據的所有權。它是FIRM體系中數據交換層的一種實現範例。

未來,同盾科技也將發布FIRM體系演算法層和應用層的參考實現:咖啡因演算法庫Caffeine和聯邦信使應用介面SAFE(Service Ambassador for Federation)。

1.2.3 InceptionAI天啟可信AI開放操作系統

為了更好的服務知識聯邦各環節的開發者、服務提供者和使用者,更全面地支持互聯互通、協同發展,同盾進一步提出了「InceptionAI天啟可信AI開放操作系統」。這一系統不僅實現了用戶和各種傳統硬體資源之間的交互,更管理了知識聯邦中各種任務聯盟進程和安全合規的虛擬大數據。

作為可視化、易使用的業務操作系統,除了用戶熟悉的Mac或視窗桌面,天啟InceptionAI具備三個顯著特點:

首先,它構建了一個開放互聯的知識聯邦生態。「開放互聯參考模型(FIRM)」中的通信層、數據安全交換層、演算法層、應用層中的模塊都可以替換,開放給第三方開發。

第二,為了繁榮生態,天啟開放聯邦市場,提供數據商店(數據要素市場)、演算法商店、模型商店和應用商店。這些開放市場極大的方便了數據生產要素的充分流通、使用、定價;也極大的方便中小企業利用天啟的系統功能,快速開發豐富、有特色的服務和應用,可以類比移動App的廣泛普及。同時,它通過開放協議,開放標準來確保安全的數據交換是可信AI的最基礎功能,不可或缺。

第三,天啟內嵌監管中心,提供一系列基礎工具和可視化應用,為監管科技的發展與落地提供支撐。第三方中小企業也可以開發天啟App提供各個領域的專有監管工具,滿足各個行業各個層次的監管需求。

高度開放的天啟操作系統,通過開放聯盟、開放標準、開放協議、開放互聯、開放源碼,希望打造一個開放社區,建立可信AI生態。

1.3 同盾發起成立開放聯盟:知識聯邦產學研聯盟(AKF)

2020年10月,由同盾科技牽頭成立了知識聯邦產學研聯盟。同盾希望通過開放聯盟方式,將知識聯邦通過產學研聯盟的方式,把產業界學、術界聯合起來,力圖將從學界產生的想法,反哺給企業界,企業界也能把一些需求和場景開放給研究院研究,雙方共同打造可信AI。

1.4 同盾隱私計算商業價值及未來布局

(1)同盾隱私計算產業布局

首先在金融領域,同盾積極探索更多的落地場景。金融場景中所有需要多方參與建模、知識共享的場景都可以應用知識聯邦。尤其是針對個人的貸前風險防控、反欺詐、反洗錢和多頭共債中。

其次,在國家關注的政務大數據上,通過知識聯邦可以幫助政府實現安全的數據虛擬融合,實現數據聯邦檢索,在保護個人信息的情況下,建立政府數據向社會開放的安全渠道。同時,可以為各部門行政審批事項梳理和業務流程再造提供支持。

此外,在智慧城市建設發展中,知識聯邦同樣可以發揮重要的作用。例如在車聯網,通過知識聯邦可以保護車主行為習慣的前提,讓每輛車輛與周邊車輛保持安全的信息交流,為自動駕駛形成助力。在社區監控、疫情普查或智能門禁中,利用知識聯邦可以將區域或家庭監控系統與公安的犯罪嫌疑人資料庫連通,通過本地計算分析,在保護過往行人的隱私情況下,對發現的潛質嫌疑人及時報警等。

部分落地情況:同盾與電網企業通過智邦平台合作,在保護數據隱私的基礎上分析企業的電力使用情況,為中小微企業提供徵信判斷依據,幫助銀行做好中小微企業的信用風險分析;保險金融營銷領域,幫助某銀行從海量客群中挖掘潛在保險用戶,有效提升銀保營銷轉化率,提高保險銷量產品和渠道的多樣性。

(2)同盾隱私計算海外布局:

目前同盾隱私計算已經落地東南亞、北美、南美等多個地區。同盾在美國矽谷設立認知實驗室,在加拿大設立北美智能風控實驗室,探索風控及相關領域產業應用和商業創新的路徑。

(二)星雲Clustar

星雲Clustar是國內率先開展隱私計算技術實現與應用探索的公司,專註金融場景提供隱私計算全棧技術服務,以IEEE聯邦學習標準工作組秘書長單位牽頭完成聯邦學習首個國際標準認證發布,其算力加速能力處於行業領先地位,核心產品星雲隱私計算平台已實現商業化。星雲Clustar目前與招商銀行、建設銀行、微眾銀行等技術實踐領先的金融機構達成深度合作,共同解決金融場景的數據安全及數據價值共享難題。

星雲Clustar創始人陳凱為香港科技大學教授,香港人工智慧與機器人學會副理事長、網路及AI系統領域世界權威專家,核心團隊來自香港科技大學、北京大學及中科院等知名院校,以及騰訊、阿里巴巴、微軟、IBM等知名企業的行業專家。

目前,星雲Clustar研發人員佔比超80%,均來自於全球各大知名院校或企業。研發團隊先後在IJCAI、IEEE等頂會和期刊上發表了多篇論文,並形成了一系列專利成果。截至2021年7月,星雲Clustar累計申請專利多達91項。根據專利檢索平台incopat數據,星雲Clustar 隱私計算技術專利申請量(包含隱私計算&聯邦學習&同態加密)在全網排名第9(含各大高校及大型互聯網公司),作為獨立技術公司排名第1 。

2021年5月,星雲Clustar宣布完成1100萬美金A+輪戰略融資。在該輪融資后,星雲Clustar將持續加大技術研發投入並深耕金融服務場景。

在產品方面,為滿足數據應用流通與隱私保護需求,星雲Clustar基於聯邦學習與各類創新技術,形成了包括星雲隱私計算平台、安全數據網路、數融天鑒系統、FPGA加速卡等軟硬體產品在內的一系列創新成果。可提供從海量可信安全數據接入、多源數據融合隱私計算、許可權管理以及數據通信存證審計、數據加密與算力加速的軟硬體「一站式」服務,解決機器學習框架環境配置、IT部署能力要求高,數據資源申請周期長、數據必須明文傳輸,模型訓練操作門檻高、模型結果複雜難於查看以及訓練過程中審計存證難等問題。整個產品體系,可以進一步提升隱私計算在實際應用場景中的效果、安全性與性能。

圖:星雲Clustar隱私計算全棧解決方案邏輯架構圖

1、星雲數融天樞數據安全網路(SDN)

星雲數融天樞數據安全網路SDN(Security Data network)為數據應用方和數據源方提供安全、合規、高效的數據安全網路。由底層安全計算框架和軟體應用層構成,分為數據源方客戶端和數據應用方客戶端,幫助B端企業實現基於隱私計算的聯邦學習建模任務,提升業務效能;同時幫助數據源企業激活數據資產,實現數據價值運營。SDN的搭建,使得數據應用方通過隱私計算技術合法合規地調用到更多的外部數據,提升業務效果。

2、數融天鑒系統,創新「聯邦學習審計」

目前,聯邦學習的應用對安全性的需求與日俱增。聯邦學習中,參與方具有審計所有出入通信/流量的需求,以進一步確保通信和計算的安全性。然而,市面上尚未出現專門用於聯邦學習審計的軟體或產品。

具體地說,聯邦學習任務可能受到控制流、演算法流、數據流三個層次的攻擊。這些攻擊有可能導致聯邦學習演算法執行停止、模型訓練被破壞或者泄露隱私。

為了解決聯邦學習中缺乏用於審計的軟體的問題,星雲Clustar提出了一種用於聯邦學習審計的軟體架構——數融天鑒系統。天鑒系統將會布署在聯邦學習參與方的通信模塊上。在聯邦學習的任務中,天鑒系統會抓取所有出入當前參與方的數據流量並進行審計,並報告給管理員,進一步確保通信和計算的安全性。

3、星雲隱私計算算力解決方案

星雲隱私計算算力解決方案採用了自研的高性能加速網路技術與自研業界首個異構加速方案,大幅強化分散式計算的通信效率與計算能力,突破傳統網路通信中算力在多點間不能有效橫向擴展的瓶頸,實現50-70倍的單點算力提升,將計算節點之間的延遲縮短3倍以上,功耗節約70%以上,解決隱私計算因使用同態加密而產生的計算壓力與時延問題。

在隱私計算領域,星雲Clustar是算力提升的高手。星雲Clustar創始人陳凱預計,未來通過軟硬體的進一步優化,可使這個倍數變為100倍以上,從而使隱私計算技術進入更多的應用場景。

作為開源聯邦學習生態FATE一員,微眾銀行人工智慧部副總經理、FATE技術指導委員會主席陳天健曾評價,技術委員會中,「星雲Clustar是性能擔當」。

在深厚的技術積累的基礎上,星雲Clustar還在落地布署上進行了優化——星雲FPGA加速卡支持雲端布署。這在應用中有幾個方面的優勢:

第一,FPGA雲上環境完備,包括算力、帶寬、存儲等,能方便快捷地布署及應用。

第二,雲端海量數據能直接在雲端訓練,無需本地存儲和傳輸,能大大提升訓練效率。

第三,FPGA雲能耗比相較於GPU提升45%以上 (FPGA單卡對比Tesla V100 GPU)。

第四,在中美貿易的戰的大環境下,自研設備難度和時間成本過大,使用雲上算力加速無需置備昂貴的伺服器以及相關設備,節約成本。

從技術維度上講,算力將成為隱私計算後續發展的最核心的競爭之一。以後的隱私計算行業會吸納越來越多的機構進場,隨著市場規模的擴大,對算力的需求也必要會增加。而且只有在算力層面上取得了突破,AI領域中的很多不可能才能變成可能。

未來,星雲將繼續深耕金融行業,在底層技術上極大投入,構建數據安全連接的新一代基礎設施平台。

4、產業應用案例

(1)某國有大行合作項目案例

在某大型國有銀行的落地項目中,星雲Clustar深度結合業務需求,為其搭建了基於聯邦學習的多方安全建模平台,滿足了業務方聯合查詢、聯合建模、聯合運算等場景的數據合規流動,同時對數據資產、流程日誌、加密中間結果進行安全審計以確保流程可追溯,以「可用不可見」的方式幫助該銀行打通全行內外部的數據共享,優化流程標準與降低管理成本的同時,為該銀行未來進行更大規模的數據開放提供了技術基礎。

(2)某大型互聯網銀行合作項目案例

某大型互聯網銀行為打通數據安全交換路徑提供聯邦學習系統方案,該聯邦學習系統需要對敏感數據進行同態加密計算,因而帶來計算量和傳輸量的劇增,使其聯邦學習系統面臨巨大的算力壓力。

星雲Clustar依託隱私計算算力解決方案助力該行實現聯邦數據網路算力加速,通過自主研發的隱私計算加速卡,使同態加密算力提升50-70倍,聯邦學習框架效率整體性能則提升2倍以上,成功推動其聯邦學習系統高效運轉落地。

(三)瑞萊智慧

瑞萊智慧是零壹財經在調研中發現的一家具備硬核科技創新實力的公司,在隱私計算技術方面取得了重大的創新突破。

瑞萊智慧成立於2018年7月,孵化自清華大學人工智慧研究院,是全球領先的安全可控人工智慧基礎設施和解決方案提供商。團隊由中國科學院院士張鈸、清華大學人工智慧研究院基礎理論研究中心主任朱軍共同擔任首席科學家。目前,公安部、多家股份制銀行、頭部城商行等都是瑞萊智慧的合作夥伴。

2020年12月,瑞萊智慧首次發布了隱私保護計算平台RealSecure。

1、RealSecure技術特點

隱私保護計算平台RealSecure是一款數據安全共享基礎設施,通過將計算移動到數據端,打通數據孤島,實現數據可用不可見,解決跨機構數據合作過程中的數據安全和隱私保護問題,驅動聯合風控、聯合營銷等金融場景業務增長。平台主要包括安全多方計算、聯邦學習與匿蹤查詢三大功能模塊。

圖:瑞萊智慧隱私計算平台RealSecure

RealSecure平台具備以下優勢:

首先,RealSecure是業內首個「活字印刷」級隱私計算平台,搭載了瑞萊智慧自主研發的聯邦AI編譯器。一般開發過程中,大部分隱私計算的技術棧在遇到不同機器學習演算法時,需堆人力逐個進行安全加密改寫,被視作一項「勞動密集型」工作。瑞萊智慧通過對人工智慧和密碼學底層原理的融合突破,實現「一鍵改寫」,首創「底層數據流圖」實現自動編譯,集成新機器學習演算法(例如SVM, Matrix-Factorization)時,無需針對每個參與方編寫對應的計算邏輯,同時支持適配上層多種機器學習演算法,極大提高了易用性與可擴展性。

第二,RealSecure革命性地使用了全同態加密技術,實現性能和安全性的雙重提升。一般來說,全同態在加密和計算方面比半同態會更耗時,但瑞萊智慧利用SIMD(全稱Single Instruction Multiple Data,單指令多數據流)技術對多條數據進行同時處理,在整體上實現比半同態方案更快的效果。通過編譯器驅動高效加密演算法的優化,隱私保護下完成全流程建模,總耗時從日級別縮短到小時級別,領先業內平均水平數十倍。同時基於格密碼的加密方案能夠對抗量子攻擊,比傳統半同態方案具有更高的安全性。

第三,直觀可驗證的安全性。傳統隱私計算模式的安全性依賴於「專家驗證」,無法做到自動驗證。RealSecure則通過把聯邦演算法協議抽象為中間層表示(IR),以數據流圖的形式直觀展示加密過程,底層執行的計算公開可審計,同時深度結合密碼學證明,支持完整證明聯邦演算法協議的安全性。基於此,瑞萊智慧也構建了嚴謹且可論證的「事前」「事中」「事後」安全體系,提供「協議模型及安全性假設、技術實現原理、數據抓包監測、運算日誌列印審計」全方位的安全評估驗證。

2、RealSecure應用案例

2.1橫向反欺詐建模及黑名單共享案例

(1)業務背景

銀行的風控能力一直被視為核心能力,但相較於大型銀行,中小型銀行在風控技術和經驗上一直處於劣勢。一般來說,各銀行在自身業務的開展過程都會積累沉澱黑名單,用來在前置風控環節識別並剔除不良用戶,但對中小銀行來說,因為其業務開展的時長及覆蓋的客戶有限,積累的黑名單普遍較為局限,難以用於精準高效的識別不良客戶。而且中小行積累的欺詐樣本不足,無法支撐其構建效果優良的交易反欺詐模型,導致行方反欺詐工作開展的效果一般。

在此背景下,中小銀行迫切希望能夠獲得其他金融機構尤其是同類銀行的黑名單以及欺詐樣本數據,實現自身風控能力的提升。但隨著《數據安全法》、《個人信息保護法》等政策的相繼出台,銀行機構之間的數據輸出與共享受到限制。

(2)解決方案

為應對以上痛點,瑞萊智慧基於RealSecure平台提供了「橫向反欺詐建模及黑名單共享」解決方案,幫助各家中小銀行在安全合規的前提下實現黑名單的共享、金融聯盟風控反欺詐共建。

1)橫向聯邦反欺詐

具體實施中,參與的銀行方需部署RealSecure平台節點,實現互聯對接。項目前期以銀行A和銀行B作為試點進行方案的落地。

圖:RealSecure橫向聯邦交易反欺詐示意圖

基於RealSecure平台,銀行A和銀行B分別準備相關反欺詐樣本數據,包括標籤和特徵,上傳至隱私保護計算節點,通過橫向聯邦的方式,基於雙方銀行準備的反欺詐樣本數據進行特徵對齊及建模。在雙方數據可用不可見的情況下,構建效果更優的反欺詐模型。

2)黑名單共享

具體實施中,由某大型股份制商業銀行牽頭,與N家銀行分別各自部署RealSecure平台節點,基於匿蹤查詢技術分別為對方提供隱私黑名單查詢服務,如下圖所示。

圖:銀行間基於匿蹤查詢技術查詢黑名單示意圖

匿蹤查詢是在發起方不暴露查詢ID的前提下,能夠獲得該ID在其他機構的信息。在黑名單共享場景中,ID為用戶三元組,待查詢的信息為是否在黑名單中,通過同態加密技術,對ID和信息進行加密,並對外提供黑名單服務。查詢方可獲得黑名單信息的密文結果,並且僅能解密查詢方發起請求的用戶ID的黑名單標籤值。

在實際業務中,銀行一要判斷一個用戶是否是黑名單用戶,首選會以用戶ID作為Key,在本地查詢該用戶是否在黑名單內,若命中,則返回。若未命中,則通過匿蹤查詢技術,向銀行一、銀行三、銀行四查詢用戶ID是否在在黑名單內,返回結果。業務流程如下圖所示:

圖:運用匿蹤查詢技術查詢黑名單業務流程圖

(3)方案效果

表:應用RealSecure前後銀行反欺詐效果差異

模型效果方面,在橫向聯邦反欺詐場景中,銀行A、銀行B在本地構建的模型,AUC值分別為0.71和0.72,KS值為0.31和0.32,而通過RealSecure平台構建的模型AUC和KS分別是0.74和0.35,一定程度上為行方反欺詐業務帶來了顯著的指標提升。性能方面,銀行A和銀行B分別提供百萬級別的訓練樣本,平台每進行一次聯邦建模的總耗時僅在分鐘級別內,接近模型本地訓練的性能。

(四)金智塔科技

在零壹財經調研接觸的案例當中,金智塔科技的隱私計算產品是屈指可數的由國家重點研發項目轉化的成果。金智塔科技由浙江大學人工智慧研究所和浙江大學互聯網金融研究院聯合孵化的國家高新技術企業,是國內領先的隱私計算行業服務商,致力於大數據和隱私計算領域的技術攻堅,為金融機構、政府、大型企業提供數字化轉型解決方案,擁有三十餘項專利和軟著並先後通過CMMI3、ISO9001、ISO27001、工信部隱私計算評測等資質認證。公司由斯坦福大學訪問學者、浙江大學人工智慧研究所博導創立,核心團隊來自浙大、阿里、螞蟻、網新、同花順、挖財,具有豐富的實踐運營經驗。

1、金智塔隱私計算解決方案

「金智塔」隱私計算平台是國家重點研發項目「大數據徵信及智能評估技術(2018YFB14030003 )落地成果。

金智塔科技作為早期得到國家重點研發項目支持,開展多源多模態數據融合與跨域聯合建模的企業,與浙大、清華、北郵、中科院、國家計算機網路與信息安全管理中心、浙江省農信聯社等共同研發打造「大數據徵信服務平台」,平台已匯聚包括徵信、房產、發票、知識產權、移動運營商等海量權威數據合作夥伴,同時結合公司豐富的行業經驗,平台內嵌了支持多應用場景的常用聯邦學習和多方安全計算模型,實現了數據分級分類管理、數據質量審計、模型效果審計、數據應用存證等數據安全與隱私保護全流程管理。具有節點擴展成本低、部署迭代便捷、運算效率高、演算法擴展靈活等優勢。經工信部信通院最新評測結果表明,全部指標位於行業頭部,部分指標位居第一。

目前該平台已在金融智能風控與智能營銷、政務數據合規共享、傳統產業數據資產建設與數字化轉型等領域實施運營,助力數智化應用,推動數字經濟發展。

圖:金智塔隱私計算平台框架

此外,由於學術背景深厚,金智塔科技在基礎研究方面實力較強。金智塔科技目前為2021年人民銀行杭州中心支行研究課題《金融科技倫理髮展背景下的數據治理問題研究》。項目研究成果將推進央行金融數據綜合應用試點,推動金融科技倫理體系建設及數字治理高質量發展。

2、金融科技實戰經驗豐富

在進入隱私計算領域之前,金智塔科技在金融科技的實際應用方面積累了豐富的經驗,這也為金智塔科技的隱私計算產品在金融場景中更好地落地打下了堅實的基礎。

2019年5月,金智塔科技推出「知他」一站式大數據分析建模服務平台,運用大數據、人工智慧技術,深入業務場景,實現在營銷、風控、運營等方面的智能化應用,推動金融機構數字化轉型。這是金智塔科技在為多家銀行提供建模的經營積累基礎上搭建的平台,提供營銷和風控兩大類模型。

基於這個平台,金智塔科技推出一些列產品,包括「知他」企業貸款、「知他」房產貸、「知他」房產貸、「知他」智能營銷、「知他」智能建模、「知他」大數據建模平台。

3、落地成果與未來展望

金智塔隱私計算平台經過多年技術積澱,不僅服務於金融領域,同時也在智慧政務、智慧產業等領域產出豐富落地應用效果。

金融智能領域,已將基於金智塔隱私計算的聯合智能授信推廣到數十家農商行、城商行和股份制銀行,取得了良好的社會效益和經濟效益。同時,還為多家機構開發了聯合智能營銷解決方案,受到了金融機構的歡迎。

智慧政務領域,金智塔隱私計算平台通過與省市數據管理部門和業務管理部門合作,在政務部門內部數據共享、數據交換、數據校驗等方面提供隱私保護技術支持,同時為政務數據的社會開放提供解決方案。

智慧產業領域,金智塔隱私計算平台依託其技術優勢,積極賦能傳統產業轉型升級,近年來在零售企業智慧選址、銷售預測、智能營銷推薦等領域逐步積累經驗,助力企業數據資產建設,賦能企業數字化轉型。

(五)天冕科技

天冕科技是金融科技集團WeLab匯立集團旗下一站式金融科技服務商。在入局隱私計算的廠商當中,天冕科技是有深厚智能風控業務積累的非常典型的廠商。

金融科技集團WeLab匯立集團創立於2013年,運營亞洲首批持牌虛擬銀行——WeLab Bank(匯立銀行)以及提供其他純線上消費金融服務。在過去八年中,WeLab匯立集團自主研發的多維度風控系統WeDefend在業界已經頗有聲望。

早在2017年,天冕科技的前身、WeLab匯立集團旗下一站式金融科技服務商「天冕大數據實驗室」已經開始密切關注隱私計算的進展,並於2019年啟動研究,2020年下半年開始嘗試將隱私計算產品落地。

天冕科技的隱私計算服務有幾個顯著的特點:

第一,有硬核科技支撐。隱私計算技術的應用,技術難度較大,需要硬核科技的支持。廠商要在場景中做好服務,是對自身科技實力的考驗——因為在場景應用中,有不少複雜難題需要解決,要解決這些問題,必須將技術中的難點攻克。

天冕科技的隱私計算業務一直堅持自主研發和創新,目前在隱私計算方面已經積累了11項專利。

表:天冕科技隱私計算相關專利列表

資料來源:天冕科技

這些專利聚焦於解決技術應用過程中的複雜難題。這些難題主要分佈在三個方向上,即如何提高產品的安全性、性能和效果。

天冕聯邦學習平台就應用了多項業界首創技術,譬如支持輕量級、一鍵部署的計算框架——函數計算。具體來說,市面上現有的聯邦學習產品,其計算框架層大部分集成的都是計算引擎Spark(Apache Spark是專為大規模數據處理而設計的快速通用的計算引擎),使用Spark可為建模過程中提供高效的運算,但是部署一套Spark集群相對來說,比較耗時、耗力,且大部分情況是使用雲伺服器,從而導致聯邦成本比較高。WeFe平台另闢蹊徑首創支持在為用戶提供Spark集群的基礎上,還可選擇使用函數計算,從而實現彈性計算,動態擴展資源,節省成本、提高效率。

再比如,其中一項專利是「基於聯邦學習的建模數據集推薦方法」。

聯邦學習是由多方參與進行聯合建模,在建模過程中需要聯邦成員去根據各方的數據集簡述,選擇各方都認可的數據去進行聯合建模。這種數據集簡述比較片面,只能反饋一個大概,沒有建模成功的案例參考,在雙方認可后需要反覆去建模嘗試才找到自己滿意的數據集,這樣導致參與各方建模效率不高。

「基於聯邦學習的建模數據集推薦方法」,通過對用戶自身畫像和每次建模后的結果記錄以及反饋進行權重劃分,計算出一個用戶評分,根據用戶所屬領域、數據類型等條件進行評分排序,將評分較高的可用數據集推薦給需要進行聯邦建模的參與方。這樣做可以使建模各方能夠快速找到需要去建模的數據集,並且能夠快速的達到建模效果,減少建模的嘗試次數。

這種方法可以將匹配率高的數據集推給參與方進行建模,方便各參與方選擇匹配的數據集,提高建模效率。

第二,有豐富的智能風控經驗。

過去八年,WeLab匯立集團已經擁有近5000萬用戶以及超過700家企業客戶。WeLab匯立集團自主研發的大數據風控系統WeDefend在業界已經樹立了品牌。中國郵儲銀行的首個互聯網信貸產品「郵e貸」正是與天冕科技合作推出。

目前,在用戶側,天冕科技已經與10多家金融機構建立了合作,合作的內容主要是聯合數據提供方,在各方數據不出私域的情況下,進行聯合風控建模和聯合營銷。

下沉市場是金融機構未來拓展新客戶的關鍵,而對下沉市場風控的把握正是WeDefend的強項。

風控經驗在金融隱私計算的應用中非常關鍵。數據在金融風控領域的應用非常複雜,哪些數據和演算法對提升實際業務價值最大,這些數據和演算法應當如何運用,只有通過大量的實際業務運行才能掌握。同時,在實際應用中,如何從大量的數據提供商中挑選中真正優質的供應商,也是必須用真金白銀和長時間的經驗教訓去換取的。

第三,「開包即用」,採用低學習成本、簡易的可視化操作。

早期的隱私計算產品,使用起來比較複雜,需要編寫代碼。但是天冕科技的隱私計算平台實現了可視化操作,極大地降低了產品的使用和操作門檻,使得許多初級的演算法和建模人員也能很方便地應用產品。

圖:天冕聯邦學習平台WeFe操作界面

資料來源:天冕科技

第四,將性價比做到極致。

在讓產品好用的同時,天冕科技窮盡一切努力降低產品的價格。要將產品的性價比做到極致,是對廠商巨大的考驗,這需要隱私計算廠商將那些經過實踐檢驗最有用的產品功能做到最好,同時還要捨棄產品的很多設計,將價格降到最低。

比如,現在有隱私計算廠商開發出許多看上去非常酷炫,然而在風控實戰中不一定能用到的演算法,因為其大幅度提高了產品的價格。天冕科技則主要輸出那些在風控實踐中被驗證過的最有效的演算法。

再比如,現在要優化隱私計算的性能,有非常多的途徑可以做到這一點。其中,用加速卡和專用晶元提升性能的成本較高,天冕科技優先採用了成本更低的通過GPU加速的方法。

隱私計算在金融市場的推進節奏

2021年,隱私計算開始在真實商業場景中全面落地。但是,這距離隱私計算市場的全面爆發還有距離。

根據零壹智庫的調研,我們目前看到的原因有如下幾個方面:

第一,是隱私計算技術自身的原因。

首先,性能的提升需要時間。

對隱私計算的大規模商業化應用來說,隱私計算性能的提升至關重要。因為它決定著隱私計算的數據處理效率,進而決定著隱私計算進入實際應用場景的可行性。

但是,性能的提升不是一蹴而就的。一方面,性能的提升需要大量的資金投入,對許多團隊來說,需要兼顧商務落地與技術提升,即邊賺錢、邊研發,因此這將是一個根據實際需求的漸進的過程;另一方面,性能的提升也是由需求拉動的。隱私計算目前尚處於市場開拓初期,應用場景比較簡單,處理數據量還不大,未來應用越來越多,需要處理的數據規模越來越大,對算力、性能的需求會更強。

其次,隱私計算的安全性要建立標準、贏得市場信任還需要時間。對於隱私計算的安全性,目前行業內缺乏統一的標準。目前,市場上已經出現一些不規範的操作,這有可能使得隱私計算在贏得信任方面走一些彎路。

再次,從業務效果來說,由於數據流通市場尚未成熟,所以數據的開放程度仍然有限,導致具體業務場景中可應用的數據資源也有限,這使得應用隱私計算技術為業務帶來的提升效果目前還沒法充分體現出來。

第二,是隱私計算產品價格與市場接受度的原因。

首先,目前隱私計算產品落地速度緩慢。雖然今年隱私計算平台開始規模化落地,但是總體來看尚處於初期,大多數廠商目前還處於一對一地為客戶提供解決方案的階段,產品還沒達到可以大批量複製的程度。

其次,因為目前大多為一對一提供解決方案,所以隱私計算產品成本較高,這使得價格一時無法降下來。價格要降下來,需要產品達到可以標準化複製的程度才可以。

再次,隱私計算產品要被市場接受,需要經歷一個市場教育的過程。零壹智庫在調研中發現,不少金融機構的風控部門目前並沒有意識到隱私計算能給業務帶來多少提升。許多機構對隱私計算產品的採購,需要考慮其能帶來的業務增量收益,要對比成本與收益。目前隱私計算的產品價格相對於收益來講,對一些業務體量不大的機構還不太划算。因此,許多機構對是否採購隱私計算產品仍處於觀望狀態。

第三,從市場宏觀環境來看,要分析隱私計算市場的發展,首先要看數據流通市場的發展,目前數據流通市場的發展尚未成熟。

目前,隱私計算廠商的收入主要是軟體系統的銷售收入,這只是隱私計算市場極小的一部分。未來,隱私計算更大的收入來源於數據的流通使用。因此,數據流通市場的成熟度,對隱私計算市場的發展至關重要。

作者目錄

致謝

返回搜狐,查看更多

責任編輯:

免責聲明:非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件12小時內刪除。

相關閱讀