今日头条整改首先扩招审核团队,靠机器学习推荐内容已是伪命题?

2022-03-27 00:04:33

今日头条整改行动从本月正式开始。

“今日头条将强化总编辑责任制，全面纠正算法和机器审核的缺陷，不断强化人工运营和审核，将现有6000人的运营审核队伍，扩大到10000人。”4月11日早4时33分，今日头条创始人&CEO张一鸣在其《致歉和反思》信中说。

作为国内最大的智能内容平台，今日头条一直以机器学习推荐技术引以为傲。此次大幅度扩充运营审核团队，或许是认为，以机器学习为主导的机制，已无法负荷庞大的内容审核工作，需要加大人工辅助力度了。

指控、处罚、责令关闭内涵段子

今日头条整改行动从本月正式开始

早从今年3月开始，用户可能或多或少的有所感觉，甚至提出疑问：包含低俗、违法、虚假等内容的今日头条，是不是快要不行了？

3月8日，央视财经发布《“今日头条”终于上了“头条”！，竟做起这种“黑勾当”！害苦2.4亿用户...》文章，直指“今日头条”利用“二跳”手段发布虚假广告，严重侵害消费者合法权益，并危害到相关药品企业正常经营；
3月29日央视《经济半小时》栏目直接指出，，明着合法，暗中“二跳”广告的“黑勾当”；
3月30日，就广告违规问题，北京工商行政管理局海淀分局对今日头条行政作出处罚，没收广告费并处以广告费用3倍罚款,总计达94.4万元人民币；
4月4日，、快手两家网站的主要负责人进行了约谈，要求全面整改；
4月9日，多家应用商店下架今日头条APP，暂停其下载服务3周，时间从4月9日15时起至4月30日15时止；
4月10日，。当晚，今日头条关停“内涵段子”。

近一个月的时间，，几乎在大众面前将今日头条批的体无完肤。为此，今日头条方面承诺，将把4月作为整改月，全面清查产品中存在的问题，，向公众同步整改结果。

依靠机器学习推荐机制

今日头条仅用6年便成为国内最大的智能内容平台

从2012年发布第一个版本至今，今日头条仅用不到6年的时间，便发展成为了国内最大的智能内容平台。相关数据统计，截至2017年7月31日，今日头条的日活跃用户数已经达到了1.2亿，较2016年同期翻了一倍多。

众所周知，机器学习推荐机制是今日头条最大功臣。纵观今日头条推荐的结果看，其智能算法大致走了以下几大流程：

一、数据抓取，从用户在该平台的浏览动态或其他账号日常动态中抓取相关数据。

二、用户分析，每个用户都是一个数据库，信息浏览行为越多，其数据库中的数据也越多。智能算法会对这些数据进行整合与分析，从而提炼出该数据库的关键词。

三、内容审核，智能算法主要做了两件事，消重和审核。

消重，就是辨别内容相似度，以避免推荐给用户的内容过于重复。显然，这一点，今日头条做的并不好，用户经常会看到相似内容，甚至标题、图片等都很相似；

审核方面，这是今日头条被严厉指责的关键问题所在。因算法尚未成熟，人工干预度低，导致很多未经人工审核的将色情、低俗、虚假、违法等内容通过了审核。

四、新闻推荐，这是与用户直接关联的一步。从今日头条的推荐机制看，内容会被推荐与否，与热点、点击量直接挂钩。这是智能算法对内容受欢迎程度的一次判断。

但显然，今日头条这一内容平台，并没有很好的做到其所期望的。

虽加大人工审核力度

机器学习推荐内容依旧是大势所趋

“3月29日央视报道我们的广告问题后，我不断反思自己以前的想法，反思公司现在的做法，开始大力推进公司员工提高意识、改进管理、完善流程。”这是张一鸣的反思之一。

而随后的行动，就是“强化人工运营和审核，将现有6000人的运营审核队伍，扩大到10000人。”

显然，今日头条这个人工智能内容平台，已经认识到机器学习的不足，开始更为重视人工了。对此，有网友提出质疑，从人工到人工智能是进步，从机器回到人工，这是历史和科技的倒退？

去年11月，张一鸣在2017今日头条创作者大会上透露，其头条号账号总数超120万，平均每天发布50万条内容，创造内容消费达48亿次。

以每个账号每天投稿5条内容算，头条好每天的投稿内容达600万条。除此之外，今日头条旗下还有悟空问答、微头条、西瓜/火山/抖音以及已经关停的内涵段子。该平台每天的投稿、上传内容超4000万。

仅靠1万的人工，显然是无法完全负荷审核任务的。仅从目前来说，今日头条的审核推荐机制，依旧以机器学习算法为主导，并加以大量人工辅助。

其实，除了今日头条，新浪微博、微信公众号、快手短视频、界面等平台也有相关的机器学习审核算法的加持。如新浪微博，其会实时更新关键词，如果用户发布的内容涉及到相关关键词，就会被屏蔽或删除。

而微信公众号作为现今流量排前的内容平台，其在内容审核方面则较为严谨。有过运营经历的人应该经常碰到，一旦提交审核的内容中提及了一些敏感内容或词汇，其审核时间就会非常得长。

很显然，在平台多元、领域多样、数量越来越庞大的情况下，通过机器学习审核推荐内容是大势所趋。仅靠人工，非得累死。

不过，当前的机器学习算法能工作质量，还远不及人类，否则，今日头条也就不会陷入如此窘境了。就像扎克伯格曾经说的一样，Facebook对人工智能非常依赖，希望能够通过AI改善审核机制。但想要完全依靠AI审核内容，可能还需要5-10年的时间。

机器学习算法作为每一次内容低劣指控的“背锅侠”，需要的，可能只是时间和耐心。在没有完全成熟之前，可以是主导，但绝不可以是唯一。技术提升加以人工辅助，是对用户最大的负责。

“我是工程师出身，创业的初心是希望做一款产品，方便全世界用户互动和交流。因此，在过去几年间，今日头条将更多的精力和资源，放在了企业的增长上。现在，我们必须重新梳理我们的愿景，保证所‘创作’与‘交流’的内容是积极向上的、健康有益的，能够给时代、给人民带来正能量。”张一鸣说的似乎很诚恳。

最后

快手的创始人&CEO宿华曾表示，技术让每个人前所未有的得到了表达自我的机会，但也带了新的社会问题。因为几千年来，人们所适应的，是由人呈现出来的世界。我们需要去适应新的世界。

当然，这里不得不提一句，机器学习算法是在抓取用户“行为数据库关键词”之后才进行的推荐。如果，你能抵制住低俗内容的诱惑，又怎会被这些内容推荐“干扰”？

/- 推荐阅读 -/

▲详解Uber自动驾驶汽车传感器系统，什么样的配置才能避免撞人事件！ | 镁客网深度

▲ 计算机视觉下一个技术拐点？前端成像或将开启“视觉2.0时代”

▲ 全国仅有617位AI专家，高校开设AI学院能否填补人才缺口？ | 镁客网深度

镁客网

科技 | 人文 | 行业

硬科技第一产业媒体

提供最有价值的行业观察