约从2018年开始,BAT等国内大厂,成熟的大数据公司,甚至初创科技独角兽,都在陆续布局隐私计算。
有媒体统计,2021年7月至10月,仅四个月时间内,隐私计算赛道就拿到10亿融资。2021年也被认为隐私计算进入商业落地的元年。
尤其是数字经济发展驶入“快车道”,《数据安全法》《个人信息保护法》等的出台,数据安全被重点监管,又为隐私计算加了一把火。
中国信息通信研究院发布的《隐私计算白皮书(2022年)》显示,预计到2025年中国隐私计算市场规模将达到百亿元人民币。
那么,究竟什么是隐私计算?
“我要从南到北,我还要从东到西,我要人们都看到我,但不知道我是谁。”一名浙江大学隐私计算方向研二的学生化用崔健《假行僧》的歌词,如此形容他眼中的隐私计算。
而在蚂蚁集团隐私计算研发工程师宋少威看来,“隐私计算是一杯冰美式,咖啡凉了,冰不曾存在。”“隐私计算并没有那么高大上,写代码、找BUG、修BUG才是日常。”
好像看懂了,又好像没有。事实上,隐私计算并不是单一的学科,而是一套复杂的技术体系,包含了硬件、密码学、分布式机器学习等多种底层技术。具体是指在处理视频、图像、文字、数值、泛在网络行为性信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护 。
隐私计算的核心价值是能够实现“数据可用不可见”、“数据不动模型动”。比如,现在电信诈骗、网络赌博高发,急需建立一个反诈平台,这就必须要有政府数据、互联网数据、银行数据,如果他们谁都不愿也不敢把自家的数据拿出来,这时候隐私计算就发挥作用了。它可以在保障原始数据不出库的情况下,通过隐私计算,安全输出计算结果。
在现实生活中,隐私计算已经无处不在,一顿早餐支付、一次保险理赔,都有它的身影。说到底,隐私计算是保护数据安全的。对于普通人而言,随着隐私计算应用的不断拓展,个人信息也会得到更有效的保护。
国内大厂纷纷入局
随着数字经济驶入快车道,信息保护、数据安全越来越频繁地被提及,这也加快了科技企业在隐私计算领域的布局。近年来,阿里、腾讯、百度、蚂蚁集团、微众银行等大厂均已入局。
当前隐私计算在全球范围内都处于攻坚阶段,行业正在通过开源开放的方式,降低技术门槛,加速技术普及。据了解,隐私计算国内外开源项目已达40多种。
2019年初,微众银行开源了全球首个工业级联邦学习框架FATE(Federated AI Technology Enabler),并于同年6月捐献给Linux基金会,成立FATE TSC对FATE社区进行开源治理,成员包含国内主要云计算和金融服务企业。
随后,百度先后推出了通用安全计算架构MesaTEE和开源联邦学习框架PaddleFL。MesaTEE采用了百度安全实验室提出的混合内存安全技术、机密计算技术和可信计算技术,并构建了FaaS通用计算架构。而PaddleFL则基于飞桨开源框架,为联邦学习研究人员提供了基础编程框架,并封装了公开的联邦学习数据集。
2022年7月,蚂蚁集团也宣布面向全球开发者正式开源可信隐私计算框架“隐语”,覆盖了几乎所有主流隐私计算技术路线。2023年3月,“隐语”宣布产品升级,并开源了SCQL功能。SCQL提供的简单易上手的BI分析可帮助中小机构快速解决急迫的长尾数据安全分析需求,在工业界首次实现了隐私数据从Al分析到BI分析,是隐语走向易用的重要一步。
“由于中小机构的数字化水平处于初期,数据量属于小样本阶段,Al机器学习的方式不必要也不具性价比,而以SQL语言为主要手段的BI分析是最具可行性的方案”,隐语开源框架负责人、蚂蚁集团隐私智能计算部总经理王磊表示。对于大规模数据场景来说,BI数据分析也是不可或缺的重要分析手段。“从大数据到小数据,SCQL都能满足密态数据安全分析的需求”,王磊强调。
值得一提的是,虽然众多大厂都已入局隐私计算,但从行业发展成熟度来看,国内隐私计算市场才刚启动。
应用层面还不够深入
对于隐私计算的发展前景,蚂蚁集团副总裁兼首席技术安全官韦韬表现得很乐观。他坚定地看好这个赛道,还对正在该领域实习的学生说,“隐私计算未来市场几百亿,是非常好的就业方向。”同时,韦韬也强调,虽然隐私计算市场在快速发展,但在应用层面还不够深入。
据了解,隐私计算目前在金融、医疗、政务、智能汽车、营销、工业和电信等具备大量数据基础的领域拥有较多应用,业务场景不断出现。其中,在金融领域,金融风控和获客是国内隐私计算最主要的落地场景。
国泰君安证券报告指出,随着智能汽车行业的快速发展,智能汽车有望成为继金融、医疗和政务之后的另一大重点领域。据统计,过去5年智能汽车被黑客攻击的次数增长了20倍。一辆汽车每天至少收集10TB的数据,一旦隐私泄露,对人身安全和国家安全都可造成不可估量的后果。
结合多年的从业体会,王磊在谈及隐私计算时表示,做隐私计算要沉得住气,做成一个产品三五年起。但不管隐私计算有多晦涩,技术有多复杂,投入成本有多高,它一定是这个时代最需要的技术之一。
和许多其他TO B赛道一样,隐私计算这个赛道也需要不断积累,需要入局者做好长跑的准备。