天天看点

灵智互动|内容审核的正确打开方式,你知道吗?

作者:神奇小萌萌

互联网用户已经超过 45 亿,这个数字还在成指数增长。这些用户每天产生数十亿张图像、视频、消息、帖子和其他内容类型。必须以某种方式对这些内容进行把控,因为大多数互联网用户都希望在访问自己喜欢的社交媒体平台或在线零售商时获得安全、积极的体验。内容审核是针对这一目的的解决方案:它会删除所有隐私、粗话或毁谤、伪造、欺诈、有害或对企业不友好的数据。

灵智互动|内容审核的正确打开方式,你知道吗?

对于资讯类产品和内容类产品来说,内容审核是必不可少的环节之一。借助人工智能的发展,可以让机器替代一部分审核工作,但由于内容的复杂性,人工审核必不可少。所以很多内容平台采用了算法进行过滤,通过人工和算法的有效结合来提升效率。

经过过滤后的内容基本上能保证无害,即使质量不高,但也不存在风险问题。这时企业就会面对选择是先发后审还是先审后发:

  • “先发后审”:即用户先发表UGC内容,再经过审核;
  • “先审后发”:即用户提交UGC内容后,先经过审核,审核通过后才能发表上线。

“先发后审”和“先审后发”的适用场景:

  • “先发后审”:适用于对发表内容时效性要求较高的场景,如阅读、听歌等场景下的用户评论,此时用户发表评论更多出于即兴,因此从用户的角度考虑,希望自己发表的评论能够马上看到成功、有效。比如:网易云音乐评论。
  • “先审后发”:适用于在社区、论坛、新闻平台等场景下发表文章、观点、讨论等,此时对于平台方来说需要对内容负责、并构建权威性,因此通常要审核后才能发表。比如:抖音。
灵智互动|内容审核的正确打开方式,你知道吗?

一、什么是内容审核?

主要是对包含色情、涉政、涉政敏感人物、图文违规、暴恐、违禁、广告等垃圾信息的文本、图片、音频、视频进行检测和识别,通过人工审核的方式提供审核、打标、自定义配置等能力来保障企业内容安全,简单来说就是:对用户在社交平台上上传、发布或共享的内容(文字,图片,音频,视频)进行审查从而生产高质量的内容、防止降低用户体验、保持良好的内容调性。

二、审核方式

不管是什么内容的审核,都应该包含以下四个基础模块:机器审核、人工审核、用户投诉审核、结果复审。

1. 机器审核

是按照制定好的规则或机器学习算法对内容进行审核。

通常,成熟的审核系统能将95%甚至99%以上的内容都自动审核并做出处理。确定有问题的会被自动删除,难以判断是否有问题的会被标注,进入人工审核程序。

2. 人工审核

虽然用户投诉审核和结果复审大多时候也是人工审核,但这里所说的人工审核,特指审核机器无法判别的内容,通常占平台内容数量的比例不超过5%。

但对于一些大型的内容平台,绝对数量已经很多了。在内容爆炸的时代,我们看到许多平台在全国都有多个审核中心,每个审核中心的员工数量都成千甚至上万。

3. 用户投诉审核

是前两者的弥补,有很多违规内容以前没有出现过;所以不在规则可以过滤的范围内,或者非常隐蔽,规则难以严格过滤。

用户的投诉是发现新问题的重要渠道。通过知乎的危机事件,我们更应该重视对投诉的审核,并及时据此对机器审核做出补充。

4. 结果复审

通常采取抽查方式,比如通过复审机器删除的内容,看规则或算法是否过于严格;比如通过查看人工删除和通过的内容,看员工的工作是否按要求执行;比如通过内容的整体巡查,看是否存在新的问题未被注意到。

三、审核流程

具体流程,以下图为例:

  1. 先过机器审核,机器审核 通过 或 不通过;
  2. 对机器审核不通过的,再进行人工复审;
  3. 对机器审核通过的,再进行人工抽样审核。
灵智互动|内容审核的正确打开方式,你知道吗?

技术的发展离不开数据的支持,内容审核需要积累大量训练数据用来验证算法,不断地提高识别准确性。灵智互动承接过多个内容审核项目,有着丰富的项目经验。

案例|腾讯 小世界内容审核

灵智互动已为全球超百家单位提供人工智能基础数据服务,高效、超值是我们最常听到的反馈。灵智互动的服务遵旨是用最优的数据方案,做最高质的数据。数据改变企业,数据改变生活,感谢有你!

——灵智互动——

与灵智互动携手,引领Ai数据时代,共享智慧硕果

继续阅读