共建新型数据交易所,「华控清交」希望专注于数据流通基础设施建设
数字经济时代到来,大数据人工智能等前沿科技不断涌现,全球数据量和数据节点数量呈现爆发性增长的趋势,海量数据的价值已经无可厚非。在政策端,数据也作为新型生产要素被写入文件,与土地、劳动力、资本、技术等传统要素并列为要素之一。
在这些大趋势下,不久前北京国际大数据交易所(以下简称“北数所”)宣布成立。据了解,北数所是国内首家基于“数据可用不可见,使用可控可计量”新型交易范式的数据交易所,定位是打造国内领先的数据交易基础设施和国际重要的数据跨境流通枢纽。另外,北京国际大数据交易有限公司作为北数所的运营主体,由北京金控集团作为第一大股东发起设立,股东方还包括华控清交、京东数科和微芯感知等3家企业。
回看过往,数据交易所在国内早已不是首次出现。并且在近几年的发展中,数据交易所已经从1.0迭代至3.0版本。这三个版本数据交易所的差异化,以及如今北数所的创新因素,是我们当前所关注的重点。
大数据交易所:从1.0到3.0版本
首先,1.0时代的数据交易所以2015年4月贵阳大数据交易所的成立为代表。根据《贵州日报》公开信息,截至2018年3月,贵阳大数据交易所会员数量突破2000家,接入225家优质数据源,交易额累计突破1.2亿元。但此后,该交易所未再公布过相关交易数据。
在一些业内人士看来,这类大数据交易所存在模式上的问题。具体展开,曾有媒体援引第三方技术公司高管表述称,一些大数据交易所的1.0模式是把需要交易的数据放到平台上,再通过API接口把数据连上。但后来发现,这种方式下的数据用途和用量根本不可控,接入数据交易的技术方、需求方、中介方等都可能违规私下截留数据,甚至将数据再“卖”给其他相关方。显然,这导致的后果是正规途径的交易模式形同虚设。
后来,为了在一定程度上避免数据的直接泄露与滥用,一些数据交易所进入2.0阶段,即参与交易的各方把数据和算法都放到云上的形式计算,并交付计算结果。但在这种方式中,仍然存在数据泄露和数据滥用的可能,云上的数据安全性仍然被怀疑。
于是,以北数所为代表的3.0版本数据交易所宣告到来。北数所成立时曾官方披露,其正是通过多方安全计算技术实现“数据可用不可见,使用可控可计量”。这也是“新型”大数据交易所的“新”含义之一。
隐私计算:破界明文数据流通的伪命题
华控清交CEO张旭东曾在和36氪的多次交流中提及,数据作为生产要素,存在前置的限制条件。
具体展开,在明文数据的流通场景中,数据的复制成本低,传播速度飞快。这会导致两个后果:明文数据一旦被泄露或复制,就无法限制其用途和用量,无法杜绝数据被滥用的现象;明文数据在传递和使用过程中的无限供应和无限使用使其供需曲线无法形成单一交点,导致明文数据很难通过市场供需进行定价,并形成大规模的市场流通。因此,在传统的明文计算体系下,明文数据流通在理论上是个伪命题。
隐私计算技术的发展让数据流通成为可能。根据大众对隐私计算的了解,这个新兴技术包括了基于密码学、安全性经过严格数学证明的多方安全计算技术;数据脱敏、差分隐私和联邦学习等明文体系下的数据隐私保护技术;以及基于对执行计算的硬件信任的可信计算技术。
其中,多方安全计算技术早在上个世纪八十年代就已经被提出,然而长期停留在理论阶段。自从2014年起,清华交叉信息研究院徐葳教授就开始带领学生研究多方安全计算理论的技术实现,创建了一套密文计算体系,能够通过技术手段将数据的可见具体信息和不用看见就可以进行计算的使用价值分离,实现了“数据可用不可见”和“使用可控可计量”。这样就能够防止计算结果需求方把明文数据原料拿回家使用时进行复制、传播和滥用。
华控清交:新型数据交易所的技术提供方,定位数据流通基础设施的建设者
在北数所运营主体的四个发起股东中,可以看出华控清交具备提供相关技术的能力。36氪此前报道,该公司是由清华大学于2018年6月通过转化姚期智院士和徐葳教授的科研成果而发起成立的数据科学企业,前高盛全球合伙人张旭东先生出任CEO,清华大学徐葳教授担任首席科学家。其是专注于研究、开发和建设基于现代密码学和博弈论的大数据安全融合与流通的技术、标准和基础设施的企业。
纵观整个行业,隐私计算自2018年左右出现技术厂商,在2020年随着政策趋势迈入行业元年,在今年被不少业内人士视作“商业化元年”。根据36氪了解,当前号称参与隐私计算生态,拥有技术提供能力的公司已达数十家。但在自身定位上,各家存在不少差异。首先从行业分类,金融、政府和医疗数据价值已被多方认可,但由于各行业数字化、信息化基础不同,当前更多隐私计算厂商主打金融、政府行业。另外在细分行业之中,厂商也已经出现应用层和底层基础设施的定位差异。「华控清交」的定位即是做数据流通基础设施建设者。
基础设施,意味着底层、通用和大规模。华控清交从底层原理和实现技术架构层面做了大量工作,主要集中在两个方面:通过对密码学理论实现、底层协议、分布式计算、系统、算法、数据库、编译和芯片等方面全方位的持续优化和创新,把多方安全计算的性能耗费从明文的5-6个数量级降低到了目前的10-50倍,并创造了明文和密文的混合运算。这带来的效果是大幅提高计算性能和功能的灵活性,大幅降低多方计算的应用成本(算力和时间耗费),实现了多方计算实用化。
同时公司创建了一套用于开发制造隐私计算应用的通用平台,大幅度降低了开发隐私计算应用开发的技术门槛,使掌握通用编程语言的普通程序员就可以像在明文环境里一样开发“数据可用不可见”的隐私计算应用。
另外,公司副总裁宋巍也向36氪介绍,华控清交的定位一直是基于自身平台帮助各参与者开发各种各样的应用,就好似车厂生产流水线和车辆产品之间的关系。其还认为,作为北数所的第2大股东,华控清交以多方安全计算为基础的隐私计算技术提供技术支持,共建国内首个以“数据可用不可见,使用可控可计量”为特色的新型国际大数据交易所,助力数据在社会范围内的交易和流通,也更能彰显华控的基础设施定位。
另外,在当前隐私计算的技术厂商中,可以看到互联网巨头、大数据公司、区块链公司等不同背景角色的身影。宋巍认为,华控清交的学术背景色彩较深,本身不经营数据业务也意味着身份的相对中立性。“数据交易的模式要持久,需要身份中立、技术中立、平台中立,而这也是华控的特点之一。”他说。
总而言之,从当年的贵阳大数据交易所到如今北数所的成立,大数据交易所一直在技术、模式等方面进行迭代。36氪关注到,在北数所之外,还有不少地方的数据交易所也有所动向。相信在接下来的一段时间内,关于大数据交易的技术落地情况、运营模式进展仍然会是业界讨论的热点。
相关推荐
共建新型数据交易所,「华控清交」希望专注于数据流通基础设施建设
华控清交:打造通用平台,提供隐私计算“生产流水线”
华控清交CEO张旭东:数据“可用不可见”和“规定用途用量”,让数据真正成为生产要素
华控清交:解析数据安全融合平台的运作逻辑以及应用场景
「冲量在线」与中国电信达成合作,推出区块链+隐私计算的信创数据流通基础设施
「浙江数安」推出“中立国”大数据联合计算平台,公司背景融合国企、网络安全和大数据上市公司
提供智能语音解决方案,「华控智加」专注服务2B&2G客户
让大数据为疫情预警——大数据在疾控应用中的方方面面
宽带汇·2019 5G高峰论坛,共建「数据驱动产业互联网」新生态
依托清华环境创新研究院,「苏州允清」发力新型热化学处理技术
网址: 共建新型数据交易所,「华控清交」希望专注于数据流通基础设施建设 http://www.xishuta.com/zhidaoview19543.html
推荐专业知识
- 136氪首发 | 瞄准企业“流 3926
- 2失联37天的私募大佬现身,但 3217
- 3是时候看到全球新商业版图了! 2808
- 436氪首发 | 「微脉」获1 2759
- 5流浪地球是大刘在电力系统上班 2706
- 6招商知识:商业市场前期调研及 2690
- 7Grab真开始做财富管理了 2609
- 8中国离硬科幻电影时代还有多远 2328
- 9创投周报 Vol.24 | 2183
- 10微医集团近日完成新一轮股权质 2180