何谓数据?不存在的
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:大家都在说,数据是新的“石油”,数据就是财富,数据蕴含宝贵价值。但是,何谓数据?有我的数据和你的数据这样的东西吗?数据脱离环境的话还有没有价值?其实,对于很多系统来说,价值根本不在“数据”,而在于围绕它展开的活动流之中。文章来自编译。
别人告诉我们,说数据是新的石油。每一个国家都需要数据战略,我们所有人都应该拥有自己的数据,并为此应该获得报酬。但实际上,没有数据这种东西,数据不属于你,也没有任何价值。
技术充斥着故事,但其中叫得最响的,是围绕着一种叫做“数据”的东西展开的叙事。他们声称人工智能是未来,这一切都与数据有关,数据就是未来,我们应该拥有数据,也许应该为此付费,各国都需要数据战略与数据主权。数据是新的石油!
但这些说法多半是胡说八道。没有所谓的“数据”,数据一文不值,而且其实它也不属于你。
最明显的一点,“数据”不是一个东西,而是无数不同的信息集合,每一个都与特定的应用相关,是不可互换的。西门子有风力涡轮机遥测记录,伦敦交通局有刷卡记录,你不能用涡轮遥测记录去规划新的公交路线。就算你把这两组数据都给谷歌或腾讯,对他们开发一个更好的图像识别系统也没有帮助。
讲得这么直白似乎有点轻描淡写,但却指出了大家(尤其是科技圈以外的人)经常下的结论是不对的,比方说“中国拥有更多的数据”或“美国将拥有更多的数据”这样的说法——到底是什么样的数据?美团上面每天都要新增 5000 万份外卖订单,这些订单可以帮助它开发出更高效的路由算法,但这些算法没法用来开发导弹制导系统。甚至可能都没法用到伦敦开展外卖业务上面。 “数据”不是单一、统一的存在,没法将每一行和每一种表都添加到一个巨大的数据池里面,然后获得越来越多的洞察。建立“国家数据战略”就像要求制定“国家电子表格战略”或“国家 SQL 战略”一样。
当然,当大家说起“数据”时,他们主要指的是你的数据——你的个人信息,以及你在互联网上所做的事情,其中有些是由科技公司筛选、汇总以及部署的。我们希望掌控更多的个人隐私,同时我们还希望,无论这些数据放在什么地方,我们都应该拥有这些数据的所有权。
问题是, “你的”大部分数据的意义和价值并不在于你,而在于你与其他人的各种交集。你在 Instagram 上发布的内容意义不大,关键是看谁给你的帖子点赞,他们还喜欢什么,你又喜欢什么,还有谁喜欢它,谁关注了你,他们又关注了谁,还有谁关注了他们,等等——而且这是在十亿人之间的互动网络里面向外拓展的。如果我喜欢你的照片,那就不只是“我的”数据或者“你的”数据那么简单,如果缺乏其他的点赞和关注的上下文信息的话,这些数据就没有多大价值。你没法随身携带,因为那也包括有很多其他人的数据(和隐私!),就算你真的一起带过来了,可能也没法植入到 TikTok 里面,因为 TikTok 的网络不一样,用户也未必跟 Instagram 的有重合。
也就是说,对于很多这样的系统来说,其价值根本不在“数据”之中,而在于围绕它展开的活动流之中——真正的意义不在于你发布的图片或视频,而在于社交网络如何对它做出反应,以及产品如何生成和捕捉这种反应。你可以将 Instagram、 TikTok 或 PageRank (编者注:Google 的核心搜索算法)看作是大规模的土耳其机器人——由于能理解每一个网页、图片和视频的人工智能还没有出现,所以人类需要介入到到这个循环之中,在合适的地方点赞,链接,点击和观看(当然还有创作)。这些是系统,而不是数据,价值在于流动。
正因为这种种原因,蒂姆·奥莱利(Tim O'Reilly)才说“数据不是石油——而是沙子”——聚沙成塔,数据只有汇总到一起才有价值。事实上,就算放到很简单的现金流来看也是如此——2022 年第一季度,Meta日活用户每月贡献的自由现金流也才是99 美分。
这对适用“个人”数据也适用,你可以刻意把它说成是“你的”。你的用电量与其他人无关,但它本身并没有价值,只是伦敦南部或布鲁克林所有家庭用电量之中的一颗沙子。 DeepMind的研究人员或许能够从一百万张胸部 X 光片当中发现一些新,在临床上具有重要意义的相关性——但你的 X 光片本身并不能让人从中得到任何东西,而且他们没有将这些 X 光片输入给AlphaGo 。同样地,数据不是一个东西。
这一幕似曾相似:今天围绕人工智能和数据展开的讨论,看起来很像 1980 年代围绕着数据库展开的讨论。我们能够利用信息做的事情、能够提出的问题,以及组织运作的方式,这些都与以往不同了。当数据库初来乍到之时,我们担心过,其中的一些担忧确有其事,但时至今日,没人会对美国有更多的 SQL提出质疑,或者 SAP 是德国的是不是有关系。达沃斯上面没人会谈 “SQL 殖民主义”。这些技术不是国家战略资产——人人都可以拥有它们,但用来做什么呢?数据库的存在,让实时供应链得到支持、沃尔玛公司取得成功,也让 iPhone 在中国生产成为可能——这些都是战略问题。人工智能和“数据”也是如此——它并不是什么新的“石油”,只是更多的软件而已。那么,你打算用它来开发什么呢?
译者:boxi。
相关推荐
跟谁学开盘涨1.84% 此前高管回应数据造假:不存在的
币圈遭遇“黑色星期三”背后:何谓比特币价值
“互联网思维”?幻觉,不存在的
报复性消费?不存在的
OYO酒店:大规模“裁员”说法失实 不存在“烧钱”一说
PP体育:不存在所谓的比例裁员,奖优罚劣属于常规管理
乐视网:不存在融创掏空乐视网的情况
阿里:不存在“优酷自制团队转入阿里影业”一说
适量喝酒对健康有益?醒醒吧,不存在的!
蔚来否认网传“员工购车新政”:不存在相关工作群组
网址: 何谓数据?不存在的 http://www.xishuta.com/newsview65019.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94930
- 2人类唯一的出路:变成人工智能 19070
- 3报告:抖音海外版下载量突破1 18777
- 4移动办公如何高效?谷歌研究了 18316
- 5人类唯一的出路: 变成人工智 18170
- 62023年起,银行存取款迎来 10108
- 7网传比亚迪一员工泄露华为机密 8155
- 8顶风作案?金山WPS被指套娃 7088
- 9大数据杀熟往返套票比单程购买 7037
- 10五一来了,大数据杀熟又想来, 6702