在成为鉴黄师之前,天成的工作是负责支付宝账户的安全,鉴黄工作确实部分增加了他和同事们的工作乐趣,但那种乐趣可能更偏向于技术流。“有时候遇到一张图片就会一群人一起盯着看,还会分析:哎,这是假的吧,PS的吧。”
此前的媒体报道提到过,公安部门招聘鉴黄师的硬门槛是已婚,但在互联网公司,是否已婚已经不作为筛选鉴黄师的指标,在这个时代,婚姻已经不再是性经验的指标了。
即使是鉴黄的第一天,天成也并没有特别地感到尴尬。“如果我没有看过,那可能还会脸红心跳。但大部分男生在大学的时候就都看过了。”
女性鉴黄师这个岗位并不罕见。在阿里的鉴黄师团队里,男女比例是1:1。女性工作细致,一些打擦边球行动的尺度,做了母亲的女性可能会提出一些更好的建议。
天成的团队里有一位三十三四岁的妈妈。“她不但需要负责信息安全,还有整个成人用品类目的管控。她甚至还特别了解整个成人用品的分类,是道具还是飞机杯。”这位女同事还专门去参观过日本的成人用品展、工厂。
“做安全嘛,性格开朗很重要。”孝肃取笑他的同事小丫,那个受不了黄图的新妈妈:“你这样的就不适合。”
男性鉴黄师们生活中对黄色物品的兴趣确实有下降,天成说问题在于会忍不住想起工作:“看一张黄图,我们会想:哎,这个系统应该抓到的吧。为什么没抓到?这个人为什么会在这个地方发这种东西?他想的是什么?而在大学里看黄图时,我只会单纯地想:哎,这个女的身材真好。”
天成仍有访问草榴等色情网站的需求,并且非常频繁,这是工作需要。他需要时刻更新样本库的高清大图,保证系统跟得上最前沿的节奏,系统会把长得一样的各位“某老师们”从产品中筛选出来,送到鉴黄师面前。
草榴也在盯着阿里,有问题的图刚出现,马上就能在草榴看到。
被这个中文世界最著名的黄色网站拎出来“吊打”是件危险的事,这些图片可能很快就会发布到微博、朋友圈,这也让天成格外紧张。
“第一步我会把这个信息清理干净,第二步就是找到为什么这个信息我们没有发现。”
“专职做这样岗位的人,绝对能达到这样的状态,听到前奏,知道是哪个发行方、制作方,哪个公司产的,甚至可能看到一段视频就知道大概在什么位置会出现黄色镜头。”
据说熟练的鉴黄师甚至可以清楚分辨出AV里女优的声音。
技术还无法替代的岗位
阿里巴巴旗下产品的图片日均更新量已经达到亿级。通过人力没有办法满足如此庞大的更新量,它需要强大的、智能的系统。这种系统也要学习,这也是为什么天成要去草榴上找图“教它”,就像给警犬一只嫌疑人的鞋一样。
所有可能的涉黄信息都会经过系统打分。“打个比方,如果系统打分说这个图片99%涉黄,那就几乎可以确定是,机器自己会处理。另外一些次一点分值的图片,就需要人工鉴别。”
天成介绍了自己每天的工作流程。“首先要处理一下举报的内容;第二个是针对我们系统自动处理之后,其他的需要人工进行判断鉴别的信息,做任务的申领和处理;第三个是维护我们的整个系统的性能,提升它的学习能力。”
更被看重的第三步,把日常工作当中发现的一些违规的情况,进行总结,添加到相应的样本库。丰富样本库,提高系统的准确率。
系统工作所遵循的规则和逻辑在安全部是个不允许被对外谈论的话题,一旦暴露模型和规则,防控就会失效,对手会绕过它。
不过,在整个违规信息的管理链里,利用系统事后删除只是最后一步,是下下策。大部分小网站的删帖者所从事的就是这样依靠工具的、简单重复的劳动。
阿里巴巴安全部更希望做到能在黄色信息还没有发生的时候就拦截,这在很大程度上依赖于鉴黄师们的工作反馈对系统的提升。
“今天互联网上出现一个什么新的情况,这是需要审核人员有敏感性和嗅觉的。更重要的是发现了一个新的情况之后,他要能感觉出来:管控之后,可能会有什么新的变化,提前在线上布置策略。”
处理数据、分析会员行为、通过事后处理,反哺系统的逻辑、规则、运行、管控策略,才是阿里鉴黄师工作的核心内容。让这个系统越来越像人这样思考,鉴黄师就可以尽量少地去接触各种不快的原图了。
“我们依托于一个庞大样本库。”天成介绍道,“对系统进行训练、学习,经过长时间的积累,它的准确性就会越来越高。”
超过系统认知经验的商品,会及时传递到鉴黄师的手里,所有的商品发布都在监控范围内,出现了新的东西,商量一下,很快就会被处理。
阿里安全部依据以往的系统经验开发了“绿网”,它可以帮助所有依托在阿里云平台上的企业网站实现内容自动净化。依托绿网,没有能力自己开发安全系统的小网站可以使用阿里已经成熟的技术,节省自己雇佣鉴黄师的成本。
魔高一丈
天成和孝肃都说,传黄的人也在一直成长。
原来的标题是“招小姐”,被系统屏蔽后他们就改成“有妹子,你懂的”(“你懂的”在淘宝上已经被屏蔽).
有的直接不发文字,发个图,打码,留个QQ号。
“人家挂着一张人体艺术的油画,说是卖油画的,你问他,他说:我们到QQ去聊。”这样斗智斗勇也让天成和他的团队不停地自我进化,就像在和对方推手,“真的有些人是专门在研究我们的规则和模型”,甚至不停地发图试。
当系统判断出现疑问的时候,鉴黄师们只能通过数据去搜索可疑的卖家到底在卖什么,有的时候则需要通过他的行为去锁定。
随着互联网的普及,网站已经不再是“扫黄”的主要战场,更主流的是网盘,不少内容手机客户端也能找到。它们的传播变得快速、便捷,监管也变得更困难。
“鉴黄的分工(在阿里)存在至少也有五六年了。”天成回顾了自己队伍的壮大,“原来做这个岗位和事情的人一直都有,但现在发展成专职、全职了,因为随着互联网技术发展,近两三年,这个职位(的作用)越来越凸显。”
法律法规没有也不可能穷尽每一种色情信息的具体情况,但对于企业而言,他所必须负担的“扫黄”义务,并不会因为标准的模糊而得到宽容和理解。鉴黄师们还需要探索,在模糊不清的标准面前,找出一套适合自己平台的专属标准。
中国并没有采用西方国家通常的内容分级的方式来管控不良信息,阿里巴巴法务部告诉《博客天下》,中国的色情管控法律法规“是基于我们的公序良俗,建立起了一整套适用于中国国情的体系”。
阿里有自己的规则,一个高于国家标准的、更细的准则,并且需要不断地和一线的“扫黄打非”部门保持联系。
阿里法务部对规则形成过程的描述是:“结合具体的业务场景,兼顾不同国家、地区、民族的需求和感受……除了参考规范性文件,也会与当地公安、文化广电新闻出版局、国信办等机关保持紧密联系,就工作中遇到的问题及时获取咨询建议。”
在新闻出版总署发布的《关于认定淫秽及色情出版物的暂行规定》里,除了对明确的淫秽和猥亵行为作出界定性六条描述之外,最后一条是“其他令普通人不能容忍的对性行为淫秽性描写”。
普通人不能容忍的程度并不完全一样。模棱两可的图片究竟是黄色图片还只是情色类相关,尺度全由鉴黄师把握。
这使得内部统一标准显得更加重要。“标准不能混乱掉。”孝肃说,“我们每个人的感官都不一样。”
曾经出现过的备受争议的“原味内衣”,并没有法律做出界定,但也没活太久,违反公序良俗的情况,不被欢迎。
不同的平台对同一张图片的要求也会不一样。买家买把椅子,却穿个比基尼坐在上面挤着沟,属于低俗营销,是违规。同样一张图片,出现在分享平台用户自己的账号里,就会被允许。
把系统抓取的可疑信息处理掉并不是鉴黄师最重要的任务,他们的竞争力在于,懂得不同产品和渠道上尺寸的把握。
为了统一标准,阿里巴巴要求所有鉴黄师上岗前要经过考试。
标准过低放过色情内容的员工可能会让公司因为“监管失职”负上连带责任。而标准过高也一样无法通过考试,这可能会影响成人类目的卖家的正常经营。
“阿里作为网络交易
本文来源:不详 作者:佚名