我在鹅厂做鉴黄师
编者按:本文来自微信公众号“腾讯产业互联网”(ID:hulianwangjia001),作者:加加子,编辑:叉叉,36氪经授权发布。
日阅上亿张黄图,一群人在鹅厂“带薪看片”。
一些外界标签贴在他们身上,但在内容安全的战场上,要求心无旁骛。
他们是网络世界的“黄片”狙击手,AI是战斗装备,精准锁定再一枪猛击,屏幕后的世界得以净化。
今天,让我们走进这群“不务正业”的鹅厂鉴黄师。
咕噜盯着眼前露骨的色情图片,脸唰一下红了。
四周满满当当坐着人,男同事从身后走过,眼神有意无意向她电脑飘去。
“完了,这下全世界都知道我在看黄图!”她绝望地想。
有一瞬间,她甚至埋怨起鹅厂为什么要配屏幕这么大的电脑。
这是她第一次打开客户发来的测试文件,这之前,从没想过自己真的要直面色情内容。
老员工们就淡定很多,偶尔遇到“特别”一点的内容,大家还会凑在一起研究。
有一次,同事蔡老师的工位上围了7、8个人,大家哄闹成一团,咕噜在一旁看着,有点尴尬、又心生佩服。
其实在大多数人眼里,这种场景并不违和。
在咕噜所处的腾讯安全天御内容安全团队,无论男女,都会被视为“鉴黄师”——这是个笼统又暧昧的称呼,却承载着人们对内容安全工作的全部想象。
萌妹的AI出击!
咕噜是同事眼中公认的萌妹子。戴着黑框眼镜,有一点害羞,会用可爱动漫人物做微信头像,有着日系美少女的甜美笑容。
这样的她很难让人联想到鉴黄师。但只要谈起技术相关的东西,她顿时会冷静、逻辑清晰地滔滔不绝起来。
咕噜在项目一线现场
识别违规内容,打标签、调整阈值和置信度、入库、训练AI……这些与色情毫不相关的事,是咕噜工作的底层逻辑。
工作中的她更像是一个AI训练师,日常需要根据客户的平台特点、发展阶段和需求,为它们匹配不同的AI识别策略。
例如平台刚起步时,容易有用户散播大量色情内容;平台做大做强之后,又可能面临竞品恶意导流违规内容的情况。
为了应对,需要不断做测试、收集反馈,以便进行策略迭代。这一过程中,还得运营、研发、算法等团队一起打配合,才能加强和丰富AI的识别能力,跑出一条高效的内容安全之路。
带着这些目的,咕噜已经顾不上自己看的是黄图,还是更变态的东西了。脑子里只有一个想法:清晰理解、准确判断,把不合规的东西揪出来,
有几次她还因为过于专注,忘记插耳机,不小心把音频公放了出来,好一会儿都浑然不觉,直到周围发出窸窸窣窣的笑声,她才赶紧红着脸静音。
这种尴尬的场景经常会意外蹦出,给咕噜一击,但她还是硬着头皮坚持了下来。如今已经越来越上手,还找到了工作中最喜欢的部分——建立数据展示、查找识别结果、便于人工审核的控制台,以提升策略运营效率、优化客户体验。
咕噜比想象中更快地适应了这个职业。半年前她刚入职时,对鉴黄的工作是有些排斥的。
最初跟朋友谈起,她还会挣扎一下。“哎呀不是你想的那样,我是搞图像识别的、搞AI的……”渐渐地,她也不在乎了,干脆说,“我就是做鉴黄的,怎么样?”
她觉得是自己脸皮越来越厚了。其实牵动着心态变化的,是对职业认知的深入。当她离鉴黄的技术内核越来越近,鉴黄这件事反而变得没那么扎眼。
她甚至有了“职业病”,再看到抖动小窗口、黄色小广告时,会习惯性地截图保存分析。想着,这个东西能识别吗,为什么它总是清除不掉?
“这个坎儿迈过去就好了,不就是图嘛。视频?不就是会动的图嘛!”
越色情,越简单
现实生活中的鉴黄师并没有什么特别。尤其是当技术性的一面被翻出来后,鉴黄这件事更没那么刺激了,甚至还有些令人头疼。
例如一套简单的内衣图,也会衍生出不同判断标准。可能是性感维度的商家广告,也可能是袒胸露乳、伴随着暗示性动作的色情图片。在内容安全人员眼里,这些模棱两可的要素,却是决定内容生死的差别。
“现在用户生产内容的路径太多、太容易,随时随地可以做传播,”负责天御安全产品研发的Lucas说,“需要识别的类型也在变多,以前只需要识别色情,现在还有性感、低俗、抽烟、酗酒、开车直播等等。”
AI很容易就能辨别裸体、隐私部位这种“单纯”的内容,对机器而言,老大难问题更多出现在边界模糊的UGC内容上,有时,甚至还有难以捉摸的意识形态内容。
为了稳准狠、不误杀,Lucas和同事们开始做部件识别,把人体“拆”成脸、胳膊、大腿、胸等小“零件”,从全局识别扩展到局部识别,底层识别能力粒度更细,可满足更高的需求。
鉴黄进行时
“我们也会给平台搭建二级标签体系,识别效果会有明显提升。”咕噜说。
例如在青少年保护方面,首要原则是保证不适合的内容不在青少年面前出现。为了做到这一点,需要针对平台上不同维度的用户画像,匹配更精细化的策略体系,让平台在给青少年用户推送内容时,能多一层筛选。
同时,也在尽力避免青少年成为违规内容中的一环。
虽然很难干预用户行为,但内容安全人员可以加强AI针对儿童色情类标签的识别训练,尽可能快速、全面地抓取违规违法内容,反馈给平台进行处理。
每当这时咕噜都觉得,被当做鉴黄师也没什么不好。“做安全,多多少少都会有些使命感在,我觉得我保护了一些人。”
云上广交会,团队奔赴一线保障大会内容安全
鉴黄是件正经事
由于AI技术可以更好地适配图文、音频、视频等多形式的审核需求,成为目前内容安全领域的主流技术,也是最有“搞头”的方向。
然而高科技含量不断提升,并不意味着人力就能得以解放。
这些年来,鉴黄的技术架构其实并未发生本质变化,都可以被总结为机器审核加人工复核。
机审的技术变革是最重要的部分,一步步进化到如今主流的AI技术,并在图片和文本的基础上,向音频、短视频、直播等新型内容形式细化。
但直到今天,在内容安全领域,AI和人都是相辅相成的。面对多变的市场环境和需求,复杂的、需要剖析的内容,如果连人都无法清晰揣摩,机器也只能两眼一摸黑。
“所以运营对内容安全来说非常重要,“Lucas说,“会根据标准尺度的变化、市场的动向,快速响应、快速迭代策略。”天御的通用版本几乎每两周就有一次迭代,针对每个客户的策略迭代则是1-3天。
内容安全产业的业务规模也在随着需求增长而变大。机器固然在用技术提升审核效率、控制人工成本,但需要审核的数字仍然触目惊心。目前,天御内容安全团队和腾讯优图实验室每天机器审核量约为数百亿的规模,人工审核量数百万级。
可预见的情况下,未来在内容安全领域,人与AI紧密配合的工作模式还会持续很久。
但无论是审核量有多大、策略需求变得有多块,对于咕噜他们来说,最难的仍是心理关。
现实情况中,除了色情,血腥、暴力、变态的内容同样充斥在网络中。“在某个寂寞空虚的夜晚,普通人可能会搜一些黄网,但不会有人去搜一些血腥的视频。”她说。
面对这些,就连Lucas这样的老兵也不一定能波澜不惊地消化掉它们带来的冲击。每次,咕噜都得用手挡着眼睛、从指缝中试探着看。看多了之后,眼睛甚至会自动在最不堪入目的部分失焦。
她排解的方式,是喝杯奶茶冷静一下。
实际上,对于内容安全人员来说,一直需要和刻板印象做对抗。外界对鉴黄师的评价一直在两个极端之间徘徊。
一边被“看片拿高薪”、“听音辨色”、“带薪福利”这种标签美化。另一边,又被《每天面对黄色内容,恶心到想吐》、《全网最脏的工作毁了生活》这类媒体报道疯狂揭露着最不堪的一面。
更有甚者,为这个职业打上了关于性别标签——女鉴黄师不敢告诉父母,男鉴黄师快乐并痛苦着。
这些看上去非常“不务正业”的描述,也曾让咕噜在父母面前难以解释。但最终是技术和内容安全的价值感给了她信心。
测试、梳理逻辑、补漏洞、打标签,如此循环往复,她和同事们一边训练着AI,一边把自己也锻炼成了如机器般缜密的思维大师。
“鉴黄只是一部分,现在大家在网上看到的一些比较正常的内容,已经是我们跟黑产做搏斗后的结果。希望这些东西越少越好,恶心我们就好了,不要恶心别人。”
相关推荐
我在鹅厂做鉴黄师
腾讯85亿买岛,再造一个新鹅厂,楼面价仅4200元
为什么鉴宝披上直播的外衣就变酷了? | 超级观点
我在互联网大厂做产品
从“养鹅”到“长鹅”,22岁腾讯的两张面孔
国货护肤进入配方博弈,「菜鸟和配方师」让“配方师”走上前台做“签名产品”
“黄暴”视频看出心理阴影,内容审核师能被AI拯救吗?
36氪独家 | 「天天鉴宝」一年完成5轮融资,累计融资金额达4000万美元
在华为,亲鉴历史
长期主义者「小鹅通」
网址: 我在鹅厂做鉴黄师 http://www.xishuta.com/newsview37200.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 94953
- 2人类唯一的出路:变成人工智能 19253
- 3报告:抖音海外版下载量突破1 18966
- 4移动办公如何高效?谷歌研究了 18490
- 5人类唯一的出路: 变成人工智 18351
- 62023年起,银行存取款迎来 10127
- 7网传比亚迪一员工泄露华为机密 8182
- 8顶风作案?金山WPS被指套娃 7096
- 9大数据杀熟往返套票比单程购买 7045
- 10五一来了,大数据杀熟又想来, 6865