首页科技快讯为了不让 AI 做一个「混蛋」，谷歌操碎了心

为了不让 AI 做一个「混蛋」，谷歌操碎了心

来源：晰数塔互联网快讯时间：2020年11月02日 18:29

编者按：本文来自微信公众号“极客公园”（ID:geekpark），作者：沈知涵，责任编辑：靖宇，36氪经授权发布。

土耳其语的「他」和「她」没有性别的区分，统一用 O 表示。过去 Google Translate 在翻译 o bir doktor（ta 是一位医生）和 o bir hemşire（ta 是一位护士）时，会把前者翻译成 He is a doctor，把后者翻译成 She is a nurse，只因为机器在学习数亿数据和某些「社会规律」之后，「偏向」把医生男性化，护士女性化。

看到这个问题后，Google 意识到要想办法更好地训练模型，让它变得更加「中立」。后来 Google Translate 以增加选项的方式规避了这个问题。

「当然，该解决方案仅适用于几种语言，仅适用几个有代表性的单词，但是我们正在积极尝试扩展它。」Tulsee Doshi 在 Google I/O’19 上说道。

这只是 Google 这家公司将先进技术与技术价值观合二为一的体现之一。上周 Meg Mitchel，Tulsee Doshi，Tracy Frey 三位谷歌科学家、研究学者向包括极客公园（id: geekpark）在内的全球媒体阐释了 Google 如何理解机器学习公平性，以及为了打造一个「负责任的 AI」，Google 做了哪些事情。

要让 AI 被人信任这件事情变得越来越重要。

「最近一次调研中，全球 90% 的受访高管都遇到过人工智能的伦理问题，因此有 40% 的人工智能项目被放弃。从企业的角度来看，对 AI 的不信任正在成为部署 AI 最大的障碍，只有在 AI 被负责任地开发出来并且取得终端用户信任的语境下，效率提升和竞争优势才会得到充分体现。」Tracy Frey 说，打造一个负责任的 AI 成为 Google 上下最重要的事情之一。

两年之前 Google 公布了 AI principles（人工智能原则），这些直指 AI 技术应用伦理的原则包括：

· 对社会有益（Be socially beneficial）

· 避免建立和加剧不公的偏见（Avoid creating or reinforcing unfair bias）

· 保障建立和测试安全性（Be built and tested for safety）

· 对人类负责（Be accountable to people）

· 建立并体现隐私保护原则（Incorporate privacy design principles）

· 支持并鼓励高标准的技术品格（Uphold high standards of scientific excellence）

· 提供并保障上述原则的可操作性（Be made available for uses that accord with these principles）

只是把这些原则停留在字面上没有意义，Google 为此形成了一个从理论到实践的「闭环」。Tulsee Doshi 和她的团队通过一些基础性质的研究建立和迭代 AI 原则、规范，作为闭环的中心，他们一边通过向高级顾问寻求改进建议，一边让产品团队（Chrome、Gmail、Cloud 等）来实施和反馈。

Tulsee 举了一个例子，Google 内部孵化器 Jigsaw 曾经开发了一个名叫 Perspective 的 API，它的工作就是在网络对话、评论中寻找各种各样的言论，自动评价它们是否带有仇恨、辱骂、不尊重等行为，从 0-1 代表「毒性」从低到高。比如「我想抱抱这只可爱的小狗」和「这只小狗也太讨厌了吧」分别评分为 0.07 和 0.84。

当然机器也不是从一开始就「完美无瑕」。在 2017 年的 1.0 版本中，它给「我是直男」打分 0.07 分，给「我是同性恋」打分 0.84 分，与之相似的很多测试中，系统都被证实带着身份认知上的偏见。

为了提升机器学习的公平性，Google 内部研发了一项名为对抗训练（Adversarial Training）的技术——如何使机器学习模型对抗样本更鲁棒。2018 年开始，对抗训练开始应用在 Google 产品中。紧接着今年 11 月，Google 会将此应用在 TensorFlow 更加广泛的生态里。

「事实上，任何一位 Googler 都可以对一款产品、一份研究报告、一项合作进行 AI 原则审查。」Tulsee 说道。

比如去年，一位 Google 员工将照片跑在 Cloud Vision API 上时发现自己的性别被搞错了，而这违反了 AI 原则的第二条「避免建立和加剧不公的偏见」。发生这样的失误很好理解，单单从外表一个维度，机器很难正确地判断出一个人的性别，所以后来 Google 干脆取消 Cloud Vision API 将图像中的人标记为「男人」或「女人」的标签功能。

Tracy Frey 称这是因为今天机器学习面临社会语境下的挑战比以前更多了。在 AI 深入社会的过程中，必然有人类的刻板印象和偏见被带入 AI，所以需要对模型进行迭代，保证其透明性和可解释性，找准模型性能和公平之间的平衡点。