首页科技快讯许倬云：大数据与个人隐私和基本权利不太相干

许倬云：大数据与个人隐私和基本权利不太相干

来源：晰数塔互联网快讯时间：2020年09月24日 17:50

以下根据许倬云先生2020年9月17日在高山大学、许倬云说历史（ID：hsuhistory）、美国厚仁教育集团联合出品的许倬云“十日谈”第七期部分内容整理而成。本文来自微信公众号：高山大学（ID：gasadaxue），作者：张明，编辑：朱珍，题图来自：视觉中国

一、人工智能已经进入生活中

人工智能是最近很热门的课题。

最初大家用计算机来处理大数据，希望从大数据里面寻找到少量数据不能累积的逻辑——什么是对错、什么发展方向、哪个是因，哪个是果等等。

统计学也曾经尝试过这种方法。没有计算机以前，靠人传递经验；有了计算机以后，大量的数据聚合在一起就可能更接近真正的逻辑。

我们尝试过中国围棋的人机挑战，一群当代高手与人工智能战队下棋，得到的结果是人输了、人工智能赢了。这说明大量的资料归纳、整合之后，机器得到了一套新的棋局或者牌局上的逻辑。

人通过自己思考可以做得很好，但人能考虑到的不过几百盘棋的经验而已。而人工智能消化的是上千盘甚至更多的棋局，得到总的方案更加可靠一点。

以大批的资料、大数据作为依据进行计算整合，这种情况已经开始尝试用在工业生产上。

最近许多城市在发展人工智能开汽车，前几年在美国已经实践过了，匹兹堡就是试点城市之一。

根据过去的数据得出来的一些方案，国家财政方面采用人工智能处理国家财务和大量的投资，已经有许多方案可以征询。

人工智能已经进入我们的生活之中，每个人身边都有发生，这是好的事情，但我们也得考虑其他方面的事情。

二、人工智能如何处理“知、情、意”

人工智慧仿造的是人的智慧。人的智慧分为“知、情、意”三个部分。

人工智能在“知”（知识的整理）方面有极大的功劳。但“情”（情感）方面与人的偏好、习惯、是非、对错有关，有许多不同的考虑方向，是主观方面的事情。“意”（意志）更是如此，决定事情要靠自己选择的标准、尺度和方向。

以《红楼梦》为例，读者和贾宝玉的亲人们都认为薛宝钗是更好的媳妇、更好的助手，但贾宝玉就是不喜欢薛宝钗，只认林黛玉是他的爱人。这就是个人情感跟选择问题，不是知识和意志的问题。

人工智能在这种问题上会碰到难关，不知道该如何处理。

“知、情、意”之外，我们还要考虑大数据本身是不是周全。世界发生的事情林林总总，一个小事件里面岔出去的可能性、引导的后果的方向很多。如何切割前面的因果链，切割到多远也是一个可考虑的问题；切割到恰好不够长的时候，得到的秩序是不够的。

《华严经》告诉我们，人间有无数的智慧，跟无数的天地一样。无数天地和无数智慧何取何求，你怎么做决定？一个人的意志、一时的意志、将来的意志、过去的意志，你也很难决定。因此这个时候你只求慈悲，这是佛家的意志。

三、智慧的人类已经掌握了演化的钥匙

在“十日谈”的第三讲，我们说到过法国的神父德日进。他说，演化的过程当中每个生物都在某个阶段由神给了特殊的禀赋。

神赐给人类的一些能力就是“智”，这是特殊的恩典，是α——智慧的人类的开始；将来演化到一个地步，最终的结束是Ω——上帝，上帝是绝对的“智”的总和。

倒过来讲，上帝的“智”已经在那里，上帝把无穷、无限、无边际的“智”分给人类一小块。这一小块也许成长、也许扩大，等到有一天扩大到一定的地步（也是个人生命终结的时候），要交还给上帝，α回到Ω。

德日进给我们的启发很重要。具有智慧的人类是诸种生物当中走到的最后一步，这一步下面，我们是取得了还是没有取得往前演化的能力？

假如揣摩德日进的话，我们得到了知识、智慧、意志的能力，实际上已经掌握了自己演化的钥匙，已经从α回到Ω手里去了。

Q&A：

人工智能竞争中美各有千秋

张康（高山大学2020级学员、澳门科技大学医学院教授、哈佛大学医学博士）：和美国以及其他国家相比，中国发展和应用人工智能有什么优势和短板？我们如何取长补短？

许倬云：没有长短板的问题。

重点在于：第一，谁做驱赶、努力的后盾之一；第二，谁做裁判。在美国，是市场；在中国，由于政治体制不一样、社会结构不一样，有相当大的一部分是公权力，也有相当大的一部分是学校支持和认可的研究力量。

所以，中国和美国在人工智能的发展方面没有长短板的问题，起跑点都差不多。

我对人工智能的认识是，人工智能是利用运转很快的大型计算机，在大量的材料之中挑出我们问的问题；有关的问题基本上都是复杂的统计学，在每个阶段作出“Yes”或者“No”的选择。

整个程序很复杂，因为计算机运转很快，一秒钟作出1000次、2000次选择都可以，而人的眼睛、语言交换都没有这么快的，这就是人工智能。

但人工智能本身不能替代人脑。

人脑里有许多出乎意外的东西，每个人脑子里储存的素材很不一样。人工智能要抹杀个人存储的素材，完全依靠机器；使用者本身的大脑里的素材配合着机器输进去的东西。纯粹输进去的东西是“Garbage in , Garbage out”（往计算机输入一堆垃圾，输出的一定是一堆垃圾数据）。

人脑很难量度，人脑的容量要比任何机器都大，运转速度也不是任何机器可以想象的。

所以，人工智能到目前才是刚刚起步。

论设备，中美一样多。论人力，第一阶段大量的人力将“Garbage”输送进去，出不出“Garbage”不管，硬要输进去一大堆资料，这个人力消耗非常大。

中国人多，比美国雇佣的人力要多得多，可以大量地用人力输入数据，这是中国的长处。短处是问的问题，如果是公权力主导的话，可能我们问的问题有局限性。美国是自由的市场经济，他问的问题，你不知道从哪里迸发出来的。

所以，基本上还是两个社会、两种文化的不同处决定了将来的竞争，可是这个竞争没有谁赢谁输。

人工智能的使用本身，我觉得大家都会比赛，但人多者取胜。中美两边有基本的社会条件、文化因素约束，但基本都是要靠大量的工作来证明。

工作之间会进步，工作之间一套机器学到上一个课题的资料以后它不会忘记，它会留下来，那套资料学到的逻辑它会拽进来用。

有人说，那就制止它乱套逻辑，乱套逻辑会找不到本来的目的，但最好不要制止它。它自己找课题、自己设想课题，这很好，主动权很大，它就变成人了。

可惜的是，我们把人本来的自动找课题、自动找答案的权力剥夺了，找了机器来代替人的能力。我们自己剥夺了比今天大无数倍、能干无数倍的天然机器的能力，就是你我的脑子寻找问题、思考问题的能力。

多种需求决定人工智能多种的发展方向

文厨（高山大学创办人、校长）：我之前见过Geoffrey Hinton、Yann LeCun和Yoshua Bengio这几位人工智能领域的开创性人物，他们在算法方面有开创性的突破。

在科技圈，大家认为科学基础研究还是美国走在前面，国内因为有数据的优势可以更好地进行实际的应用，在应用层面有很多地方比如视觉识别、语音、癌症治疗有可能走在美国前面。

许倬云：对于你刚刚讲的，我也有想法产生。

美国之所以把人工智能提上日程：

第一，他们的工业自动化生产需要快速设计。比如福特汽车过去的生产流程切成十二个阶段，现在有几百个、上千个阶段。它的速度快了，自动化程度越来越高。

自动化程度越高，每一个阶段切分得越小动作越简单、越容易精准，很快地配合在一起，零件到点、装配到点，马上第二个阶段跟着走。这是工业自动化流程。

把无可测知的环境考虑在已可测知的范围之内是工厂流转自动化的差别。

第二，美国交通的管制大致是混乱的，而且人力不够用，因此大家想到大量的输送要使用自动工具。自动工具在复杂的不自动的路上走，这是第二个设计。

第三是经济决策的设计。比如，交易所里那些股票的涨和跌如何预判？每一秒钟有新的股票交易，新交易的赚和赔跟所处行业全球的赚和赔配合在一起，这些都极其复杂。

过去靠交易员的直觉，现在交易员手上有一套机器。机器根据大量的数据一计算，看涨还是看跌，可以很快作出决定。

政府的决策者在战场上应该如此，经济的斗争也应该如此。这样人工智能能够活学活用，而且走的方向是各走各的路。多种的需求、多种的条件决定了多种的发展方向。

人工智能的智慧与天然的人的智慧之间还有很大的区别。人的记忆数量之大，不是普通机器能匹配的；人的分析和联系资料的能力之快，考虑周全也不是目前机器能及的。

我们对人工智能要寄予希望，但也不能希望它是另外一个“人类”，超人类的“人类”。

中国很早开始用大数据管理国家

陈航（ReadyAI创始人、美国厚仁教育集团CEO）：从1950年第一个人工智能程序在卡内基梅隆大学产生，人工智能逐渐带来第四次工业革命。

通过更多的数据分析和归纳能力，会更多直接同社会、生活、政府产生交互，带来改善和冲击。人工智能与中美文化、社会生活有什么交集？

许倬云：中国政府管理的传统——文官系统起源很早，周朝以前就开始了，但完全成熟是战国时期的国家体制。

战国七雄每个国家的人口上千万、占地五六个省，都不是小国家，与今天世界上的中等人口国家差不多。他们怎么管理国家？

中国很早就用数据来管理。秦汉政府的档案里面有地图、文卷、收税的数据、每天各种各样的数据，还有法律文件。

欧洲要到近代国家出现以后才有根据资料、根据图表数据来管理国家的经验。

中国在这方面的经验很早。

萧何打到秦国首都，第一桩事情是占领它的资料库，拿它的地图和收税资料。这一点，项羽从来没懂，他驻在秦国的关中很久，都没有拿这些资料。两下较量，项羽输了。

再谈打仗，大家最熟悉的《孙子兵法》，孙子是第一个计算战争的。多算者赢，少算者输。根据资料算得越多，赢的几率越大；根据资料算得越少，输的几率就越大。

中国用大资料是家常事情。每一朝的正史都有志书，包括地理、食货财富、生产能力、收税条件、专利、消费项目等，都清清楚楚。这么详细的资料库2000年来不断。

我认为，大数据不难，大数据关联很容易；问题是资料一大堆，要储存在哪里，而且资料要够整齐划一，可以计算。

真要论起来，每天吃饭、买菜用的都是大计算——脑子里面的计算。选什么材料，“Garbage in , Garbage out”；问什么问题，“Yes” and “No”。这些跟日常生活很有关系。大数据处理的思路在日常生活里可以用手上掌握的小数据延伸到大数据上。

我写“六十年的美国”（《许倬云说美国》），再写十倍厚都可以，数据都在日常生活中，周边都有。以《纽约时报》为例，1天的《纽约时报》可以衍生出18本书，这18本书可以提供一个将军打一次仗。

大数据与个人隐私、基本权利不大相干

王翔（小米总裁）：人工智能的算法和相关的技术在近几年来迅速进入了人类生活的各个领域。有些技术的应用可大幅度提升工作和生产效率，改善人类的生活品质但另一些可能会伤害个人隐私和其他基本权利甚至发生直接冲突。人类应如何应对？

许倬云：真正大数据算出来的东西是不属于任何个人的，而是属于人群的。属于人群的是指，大数据算出来的是某一个时代、某一个地理环境里面某一个群体、某一个工业（或产业）的情况如何，或者某一个产品的未来如何。

做更大的延伸，算出来的是甲国、乙国究竟是快速打仗，打完拉倒，还是拖着耗下去。这些计算不会牵涉个人问题。

个人问题是个人私人的问题，大数据的“大”就在超越私人，得出的是群像、通像，不会有特别的倾向。我们不会针对某个个人平时的行为用大数据分析，分析个人不需要大数据。我觉得大数据与个人隐私不大相干。

基本权利要看是一个群体受到损害，还是一个个人受到损害。大数据很难牵扯到一个有名有姓的个人，很难牵扯到一个人本身的基本权利。但是使一个阶层的群体受到损伤会有。比如大数据认定某种工厂不可能赚钱，不用开了，这个结论的结果是几十万工人马上完蛋。

有人说农业不用干了，经济的农业用精准的做法、用自动管理，不需要几个农夫。没错，但是这样做的话，我们就缺少了自动改善的机会。

个别农夫看到好的品种会留下改种；看到以前没有见过的植物会观察这个植物，它有什么长处有什么坏处。这就是个别农夫种田与机器种田的差别。

机器种田是不管田里的是西瓜、南瓜、冬瓜，机器滚过去都收下来。农夫会质疑，西瓜田里怎么出现了南瓜。这也是个别农夫种田与机器种田的不一样之处。同时也是隐私与基本权利的问题。

人的因素拿走以后，还算不算东西？它改进的余地要靠另外一次改进数据来改进机器。

本文来自微信公众号：高山大学（ID：gasadaxue），作者：张明，编辑：朱珍

许倬云：大数据与个人隐私和基本权利不太相干

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包

许倬云：大数据与个人隐私和基本权利不太相干

推荐科技快讯

移动办公如何高效？谷歌研究了两年，发现了这七个秘密

人类唯一的出路：变成人工智能（三）

饿了么口碑：今年计划招5000名员工、增80万骑手

盖茨力劝美国用核技术解决气候变化 愿掏数十亿腰包

盖茨力劝美国用核技术解决气候变化愿掏数十亿腰包