各大平台的假数据让广告主手中的不确定性增加了,艺人飙升的价码正被重估。
娱乐圈的残酷之处,在于把艺人当股票。
想象一下,在真实的影视行业中,你要面对这样的问题:
这个演员,今天看涨还是看跌?他在社交媒体上的影响力有多大、票房前景如何?现在团队接到了六七部剧,哪部能让他的商业价值最大化,也让广告主获得更多回报?
关于这些问题,这个行业以往看的是经验,但现在是数字,而且是分钟级变化的数字。
这跟互联网下全面的流量经济有关。爱奇艺大剧营销中心总经理袁嘉露用一个「四有标准」来观察一部影视作品是不是火,即「朋友圈有转发、微博上有段子、百度有指数、淘宝有同款」。
但在近两年的影视行业,热钱很多,也很混乱。拿电影举例,「2016 年估计投入在电影领域的资金超过 2000 亿,但 2016 年的票房却是 455 亿,这是一个比股票交易市场还可怕的数据。」艾漫数据创始人曹永寿说。
数据作假是彼此心照不宣的常识。因为「即使是假的,也需要好看。别人都刷你不刷,你就是最差的,投资人那里也没法交待」。
但广告主手中的不确定性增加了,流量艺人飙升的价码正被重估。大大小小的脱水公司应运而生,他们有的做出了独特的算法,有的建起「水军库」,还用上了人工智能。汪洋黑水中,他们仿佛一只只白帽,不断跟水军上演斗智斗勇的故事。
作假到底有多严重?
陈涛是德塔文科技的技术负责人,她和团队长期监测影视、艺人的各项指标,为客户提供相关决策参考。据她观察,仅在百度指数这一块,造假表现就已经千姿百态:
「有每天几乎都一样高的『平台式艺人』;还有到了月底跌得厉害、续费以后又上去了的『峰波状艺人』;也有些人会做得比较好看,是一条弯弯绕绕的曲线。但如果你多看两个人并且长期监控,有时候会发现他们的曲线走势完全一样,因为买的是同一家公司的服务。」
而另一家数据监测机构「艾漫数据」市场中心总经理王蓓则对极客公园称,现在可以说,没有不用水军的。「从全网社交平台的数据来看,6% 的水军刷了 90% 的量,集中在 TF-boys 和一些选秀出身的艺人上。大家关注度比较高的 EXO 归国四子也有,陈学冬也挺多的。」
在今年 315 这天,艾漫称自己「冒死发布一份脱水榜单」,做了一件得罪经济公司,让艺人打脸的事。(统计区间:3 月 1 日- 3月 14 日,来源:艾漫指数)
在「水军占比榜」、「最敬业水军」等几份榜单中,一些明星的水军数已经超过了总量的十分之一。且后台数据显示,「某当红小鲜肉,某日单天只用了不到 400 多个可疑 ID,就刷出了超过 17 万的讨论量」。
总之,根据他们的监测结果,我们看到的基本是个假的娱乐圈。
2016 年上映的《爵迹》曾以 3.6 亿票房扑街。「它当时至少有十个流量艺人,预测票房至少有十个亿的体量,但事实证明,每个人能够贡献票房的活跃粉丝没有那么多。」一位影视行业从业者总结道。
虽然票房不能完全和粉丝经济挂钩,影视作品是一门综合艺术,剧本、导演、演员、市场环境和造星体系都可以找到它自己的原因。但不可否认的是,这跟数据造假有关。
「一个稍微负点责任的乙方,手里一定有两到三家刷量公司或者个人的联系方式的。」上述影视行业从业者说。
据极客公园了解到的情况,从百度指数、微博热搜、微指数到各大榜单、网站评分、软文 PV、点赞和留言,甚至细到公众号文章统计口径中的「阅读来源」,没有什么做不了假。
不同质量、难度和规模的刷量对应花多少钱,这中间只是算账的问题。
对微博、爱奇艺、腾讯视频等各大平台而言,为数据「脱水」早已成为日常工作。但针对不同平台,水军有不同的「攻坚方法」。据爱奇艺 CTO 汤兴称,现在的作弊手段,可以通过大量云计算主机模仿人的行为去点击视频。
同时,他们也不得不面临市场环境的问题,以及纷至沓来的有关可靠性和利益相关的质疑。
豆瓣 CEO 阿北曾以《豆瓣电影评分八问》一文回应:水军是有的,但豆瓣评分很难刷得动……内部做到真正的独立比较容易,可以用结构、制度和防火墙做到。整个豆瓣系统里没有「修改电影平均分」的后台功能。
作假是一门成熟的生意,目前我国也并没有针对「刷量」行为有专门的法律规定。《好奇心日报》记者彭卡茜这样评论道:这是一个人人作恶,最后失去市场标准的故事。
脱水公司的靶心在哪里?
「其实所谓的水军,现在最典型的是在新浪微博。因为是营销重镇,所以水特别重要。然后是百度指数。别的地方也有水,但这两个是重点灌水的地方。」陈涛说。
「但百度指数灌水,除了做得好看之外是没有意义的,因为它就是一个数字,没有衍生价值。对于这种高,脱水是很容易的,因为百度是一个非常完备的指数,你可以通过一些细节、分层数据、趋势分析,找到作假漏洞。」
作为舆情集散地、娱乐风向标的微博,它的脱水份额通常要占到八九成。
王蓓表示,水军干活,是要在短时间内产生大的量,它不可能像正常人。7*24 小时抓取数据后,他们会「分析它跟普通的粉丝、网友在表达方式方面的一些差异性,同时要对数据做清洗和消歧。」
相对便宜的水军会使用重复或者类似重复的说辞。「虽然会稍有变化,但明显不贴合正常人的一种思维、长度、想法」。
还有「言论不相关」的,「使用同一套溢美之词,不停的排列组合」,但结果可能压根不是在评论某位特定的艺人,比如大量夸赞某个明显是演技派的演员「颜值高」。
这些 ID 被艾漫判定为水军后,就将进入「水军库」,机器也不会再计算他今后的发言。然而一旦作假的人开始走心,那就防不胜防了。
「一些比较贵的水军公司会盗取不常用的肉鸡账户发微博,而更高质量的水军是真实用户,他们受雇于某个水军公司去评论、打分,这样的就会比较难识别。」王蓓说。
在刷榜行动中,粉丝越来越成为一支不可忽视的力量。「超级星饭团」等追星产品甚至为粉丝们提供各平台的一键签到功能,包括百度贴吧、寻艺网新媒体指数、微博超级话题打卡等等。
但过于整齐划一的行动很可能是无效的。王蓓表示,「我们并不是要逮住水军,而是筛掉水军所营造出的数据上的虚假繁荣。我们打击的是『水军的行为』,即使你真的是一个很卖力的粉丝,但你刷出来的一些非正常的热度,我们就不计算在内了。」
如今,判定「何为水军」远比想象的难上许多。毕竟,真的有粉丝一天可以为偶像发上两千条微博,这到底是属于人类行为还是机器行为?追星族们可能对此有很大情绪了,认为这是正常的「粉丝文化」,但它在有关商业的度量中,真正价值几何?
豆瓣这两年的原则是,「所有能判断属于非正常评分的一概不算」,所谓非正常评分,包括了黑水军、白水军、粉丝团刷分,甚至包括豆瓣用户捍卫评分公正的「反水行动」。
德塔文团队的做法是,统计独立 ID 的有效覆盖范围,以及语料的丰富度:
「如果同样的东西都发到两千条了,你的东西还会有人看吗?这肯定是无效的。独立 ID 不管是发了一条还是一百条、一千条,我们就只认这个人的有效覆盖范围。通过他的社交链、感兴趣的人到底覆盖到多大的一个圈层,可以大概反应出他这个人潜在的辐射量。
我们分析一个演员在某一天的语料丰富程度,我认为这是评价它的思想锐度的一个重要指标。语料越丰富,它的思想锐度就越够。这种情况下,我认为这个 ID,或者这个艺人的可传播价值就越高。不管是好的坏的,起码它有足够的话题性,足够的聚焦点。
有些人他的数据做的很高,如果语料不丰富,它就和百度类似了,只是一个没有灵魂的数。」
但机器只筛除那些大范围的机器人流量,关于它的训练依然需要大量的人工盯梢。艾漫一支 20 人左右的编辑团队,就负责「把一些机器识别不出来的水军,再放到库里让它去学习,这样不停的在迭代。」
周冬雨、宋茜们的数据特攻队
微博承认正常的冲榜行为。真正担心自家爱豆商业价值的粉丝,少不了要为他们组建「数据特攻队」,为热度、搜索关联词、销售额,甚至其所属经济公司的运作能力操心。
比如周冬雨的数据特攻队,会强调「看到负面不要出于好奇心去点击」、「要点击净化过的搜索关联词」。宋茜的后援团相互提醒:签到需要重视起来,豆瓣评分是重中之重,「要多给其他的电影打分,账号和昵称可以隐晦一点,还没播的电视剧不要打分」。景甜特攻组则会「日常播报扎心数据」,自发统计各平台热度和战果。
他们中间还流行着诸如不要回复喷子的言论(正确的做法是让其「沉没」)、评论区控场能力要强、不要帮低咖位偶像带热度之类的准则。在自家爱豆有重大活动之际,还需要「多开几个小号,提前养养肥」。
在明星艺人日益被数字化的今天,粉丝团并不是单纯的崇拜或者冒粉红泡泡的少女心,而是一支支并肩战斗的队伍。
这些粉丝的行为,可以影响到「提及数据」、「主动搜索行为数据」,并间接影响到「媒体曝光数据」,它们组成了一个艺人的影响力指标。
王蓓认为,在艺人的商业价值衡量中,影响力指标只是一个比较大的维度。「另外还要根据关联词,考量他的口碑、角色、社会、个人、广告形象。比如口碑层面的角色好评率,正负面分纬度计算。这些数据中,有多少在谈论他的形象、演技、婚恋、公益、言行,每个纬度下面也有不同的口碑计算。」
在艾漫的观察中,流量艺人真正的活跃粉丝数还是和带货能力强相关的。这也是为什么广告商尤其重视粉丝的原因。
微博上有个叫「天鹅湖 RTEH」的号,是粉丝专门开了为吴亦凡代言产品「晒单」的。账号描述里这么介绍自己:其实我们只是有钱
但艺人的快数据(舆情表现)和慢数据(比如票房、收视、奖项、商业代言)完全需要分开看。「有一两个能带货的演员,也不能代表这个电影就真的能卖。这是两码事。」陈涛说。
「一个剧的拼盘就定了它的命。你还要看制作公司推货能力、主创团队、题材和现在主流题材的适配度、这个题材针对的分众和电影针对的分众的适配度、导演的历史业绩、演员拼盘、演员和题材的适配度、大众心目中的兴趣度,甚至还要看剧组的和谐度,因为很多剧实际上失之于人和。」
这一切依托于真正影响决策的数据之上。但无论如何,这个行业还没有建立起确定的标准。
前几年的影视娱乐业,热钱翻云覆雨,却碰了一鼻子灰,它暴露了影视行业对风险把控的整体不足。王蓓刚刚踏入这个圈子的时候,甚至发现「这个行业没有数据」,很多事情是拍脑门决定。
如今的资本已经慢慢冷静下来,影视业处在冷却和谨慎的档口。今日头条这样的技术公司也正在尝试用 AI 进行艺人选角,发掘更多的素人演员。数据建设这条弧线也最终会落到大家有没有好电影看、有没有好剧追这件事上。
脱水行为本身并不会上升到行业净化的高度,能够支撑它继续走下去的是资本对确定性的要求。毕竟最着急的人是广告主、剧组之类的利益相关者,对于一般人而言,它不重要,这个行业里的许多流量艺人,也都需要维持一种门面上的景气度,这给注水提供了空间。
王蓓表示,「水军公司一直在观察我们的算法。大家都是在动态的调整中。」要做好脱水工作,需要海量数据和非常强的大数据挖掘技术,而且必须在一个领域内深耕很久。
至于准确性和独立性,他们愿意等待时间去验证,同时也「需要在更广泛的艺人身上做更长时间的监测。」
娱乐圈也是造梦行业。数据有时候是残酷的,它消解了我们少年时期的纯情世界,无情地翻开这个悠久造梦行业的另一面。商业在这里成为度量一切行动的尺度,但这就是现代文明发展的本质。
路漫漫其修远兮。如阿北所说,「这确实是持续的、魔高一尺道高一丈的事情。」
(编辑:蒋鸿杰)
头图来源:LucianoLuz