清华姚班的科研能力,能孵化出一家怎样的公司?

转化姚期智科研成果,清华教授任首席科学家

鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

Top2大学实验室里的科研成果,能孵化出怎样的商业价值?

现在,清华大学的又一张王牌浮出水面——

转化图灵奖得主姚期智院士和清华大学交叉信息学院徐葳副教授在隐私计算理论方面的研究成果,成立华控清交信息科技(北京)有限公司,还推出了实际可落地的商业产品。

前高盛全球合伙人张旭东出任CEO,徐葳副教授担任首席科学家,还有多位清华姚班毕业生担当研发骨干。

没错,这家公司背靠的就是清华姚班人才力量,以及清华大学雄厚的学术资源。

都说「半国英才聚清华,而清华一半英才在姚班」,所以,这样的学术背景之中,到底孵化出了一家怎样的公司?

让数据「可用不可见」

业内都知道,图灵奖得主、清华大学交叉信息研究院院长姚期智院士的主要研究方向,包含了计算理论及其在密码学和量子计算中的应用。

而华控清交正是抓住了「数据安全」这个点,基于姚期智院士和徐葳教授的科研成果,专注于研发和建设基于多方安全计算理论的数据融合技术、标准和基础设施

分析起来,原因其实很简单:数据安全问题正在影响数据流通,掣肘数字经济发展

在数字经济时代,数据可以说是关键生产要素。

人工智能技术能在寒冬之后再次复苏,引领时代技术潮流,就得益于互联网带来的海量数据。

不过,随着AI产品逐渐渗透到人们的生活当中,数据引发的隐私安全问题,也越来越受到大众的关注。

从人脸识别到智能音箱,从推荐算法到视频通讯,无不挑动人们对隐私安全的敏感神经。

从隐私安全的角度来说,数据作为生产要素,和一般生产要素相比有以下特点:

首先,数据的复制成本低,几乎可无限被复制;

其次,数据使用没有排他性,可同时被多方使用;

另外,数据可再生性强,在使用过程中会随时生产出新的数据。

这些特点导致未加密的明文数据一旦被共享,就不再受到控制,很有可能被滥用。这也致使各方不敢共享、不愿共享、不能共享数据。

如此一来,数据生产要素化就受到了掣肘,「数据孤岛」现象在各行各业中普遍存在。

那么,能不能从技术角度来解决这个问题,让数据能够在流通、最大化发挥价值的同时,防止信息泄露和数据滥用?

答案是:可以

比如姚期智院士在上世纪80年代创立的多方安全计算理论,就为实现数据可用不可见奠定了理论基础。

所谓「可用不可见」,就是将数据分离成可见的具体信息部分和不可见的计算价值部分。这样一来,就在计算价值充分流通、共享的同时,规避了信息泄露的风险。

具体而言,华控清交的隐私计算技术,是基于多方安全计算密码学范畴的理论安全性优势,结合联邦学习可信计算差分隐私数据脱敏等基于明文的数据隐私保护技术和区块链技术,创建的一套明文和密文相结合的系统。

并且,华控清交在工程上也已经实现了「数据可用不可见」和「规定数据具体用途用量」的实际落地,推出了自主研发的数据安全融合平台

数据交易流通的基础设施

根据官网信息,这一名为PrivPy多方安全计算平台的平台级产品已经实现了支持通用计算类型、高性能、集群化和可扩展的解决方案。

PrivPy集成了多方安全计算、联邦学习、隐私查询等数据安全技术,运用了秘密分享、混淆电路和可信计算等多种计算引擎。

其高性能并行计算引擎,支持横向扩展和数据并行,以及TB级的数据处理。

另外,该平台完全兼容ARM服务器,支持细粒度并行计算。

在开发方面,平台支持Python和SQL操作,兼容NumPy和Pytorch等函数库,能够支持包括绝大多数机器学习算法在内的计算类型和系统实现,能极大降低用户使用密文计算的学习曲线,实现了多方安全计算产品的实际可用性和商业易用性。

同时,PrivPy自主灵活的模块化组合模式和多种部署方式能够满足用户在使用和部署中的多样化需求。

而在安全方面,该平台具有以下特点:

  • 完备的数学/密码学证明
  • 安全假设明确而且容易实现和审计
  • 数据授权管理
  • 系统实现安全:SSL、CA认证等
  • 核心密码协议设计简单而且开放
  • 同时兼容国际开源和中国商密体系
  • 兼容区块链和可信计算的存证审计功能
  • 获得国内权威机构安全认证

华控清交的愿景,是为国家开发建设一套具有自主知识产权的、世界领先的、数据交易流通的基础设施,推动数据大规模的互连互通与融合利用,使数据真正成为社会化的生产要素,为我国全面进入数字经济时代铺设道路。

而现在,「吹」下的牛以产品形式稳稳落地,并且已经有了实际的应用案例。

应用案例

在政务、金融、医疗、安防、能源等诸多领域,打通数据孤岛,实现数据不出门的联合建模,对于行业中AI技术的实际应用有着重要的意义。

而从清华园中走出,华控清交的多方安全计算平台已经在这些行业中验证了能力。

比如实现保护数据隐私的人脸识别支付

人脸识别技术给金融行业带来了很多方便,比如刷脸支付,对大众而言已是习以为常的功能。

然而人脸数据作为极其重要的隐私数据,无论是从保护用户隐私数据方面,还是从保护数据价值方面,数据拥有方都不会愿意轻易地将其分享出来。同时,人脸查询用户也不愿向数据库运营方提供自己客户的人脸信息。

华控清交多方安全计算平台,就能从技术层面解决人脸识别的隐私保护问题。

通过多方计算平台,查询方在查询人脸信息时,只会得到匹配的结果,平台和数据源均无法得知查询意图和查询结果。

也就是说,这一过程中查询方和数据库运营方互相不暴露自己的信息,也就避免了人脸特征数据库信息泄露的风险,从而使人脸数据数据拥有方能够放心地将数据分享出来共同使用。

再以反欺诈为例。

所谓道高一尺魔高一丈,随着市场和信息化手段的不断发展,不法分子也在利用先进技术,以更隐蔽的行为和方法实施金融诈骗。

面对这样的挑战,如果能将多个金融机构的相关数据安全有效地融合在一起进行人工智能分析和检测,就能通过提高大数据池内数据的质和量来提升反欺诈的精准度,建立更智能、更健全、更有效的风控系统。

不过,金融机构的用户数据往往都有巨大的市场敏感度和潜在的商业价值。正因为如此,无论是从保护客户隐私和市场安全考虑,还是从保护自身利益的角度出发,各金融机构都不会轻易地分享这些数据。

而华控清交的多方安全计算平台,恰恰可以使拥有隐私数据的多方在不直接提供数据原文的前提下,利用其生成的数据密文进行有效的数据融合与计算,可以在保证数据隐私的前提下完成大数据融合与人工智能运算。

具体而言,通过多方安全计算平台,多个金融机构可以将数据以密文的形式上传,之后在平台全密文环境下进行反欺诈模型的联合训练、预测,用更多样化的数据锻炼出更强大的AI,提升各自的反欺诈能力。

产学研融合之道

今年以来,在疫情冲击之下,数字经济的新兴产业优势更加凸显出来,并成为构建经济发展新格局的重要支撑。

而数据,作为AI应用的基础,作为数字经济中的生产要素,更是在这样新的发展格局中发挥着关键作用。

在这样的背景之下,如何在保障数据安全的前提下,促进数据的流通,实现无边界的数据融合,就成为了学术界、工业界共同面临的全新挑战。

而现在,以华控清交为代表的企业能从国内最顶尖的实验室中走出,将前沿技术理论落地商用,无疑为打通充分发挥数据潜能这一环,注入了强有力的技术支撑。

其商业化成果,也再一次印证了产学研融合带来的强大动能,探索出了AI赋能千行百业的一条新路径。

那么,你怎么看待这样的产学研融合之道呢?

版权所有,未经授权不得以任何形式转载及使用,违者必究。