抖音推荐: 浅谈抖音推荐系统的初步研究方向!

yanfei 2020-12-08 17:33

在过去的十年里面,我都在研究搜索引擎,尤其是百度的规则。我们SEO这一行,被许多从业者自身认为是苦力活,这是让我倍感奇怪的。因为至今我从事的大部分都是基础理论层面的研究,尽管「基础理论」看着离「实际应用」颇远,但也没那么远,有收获不错的成绩——给各种大小网站共计提升过数百万的日均UV。

重视理论研究,以及重视实践出真知,这某种程度上可谓是两大门派了。根据我所观察的,站队实践出真知的人数比例往往是压倒性的。


微信截图_20221203102936.png


但是,这里有一个根本矛盾——实践出真知的「实践」,到底是该去实践些什么呢?如果没有基础理论的支撑,可能只是瞎想到什么就去瞎试罢了。

凭借着对于搜索引擎的理论研究经验,最近我开始抽出一部分精力,对抖音的推荐系统做出第一步的探索。

为什么要去研究推荐系统呢?难道不是视频内容质量决定一切吗?

这就好比做搜索引擎流量的时候,我的大多同行们也永远声张着「内容为王」,却罕见他们优质的内容有做出什么流量。

类似的,抖音上面,爆火的视频经常是发布者自己也没有预料到的,而他们有时发布的自己认为质量很高的视频反而无人问津。如果单纯把原因归结为「运气」,就太过随意了。


毕竟百度的检索系统和抖音的推荐系统,本质上都是把信息提供给用户,多少有些异曲同工之处。所以我来谈谈或许可行的研究方向,可能还算略有资格。

如何初步开启对于推荐系统的反向研究?

许多年前我就看过科幻扛鼎之作的《三体》系列第一部,直到最近我才刚把后面两部给看完了。在第二部里面,有一个我极其认同的地方。

书中,主人公罗辑通过得知了两条宇宙公理,逐步推论出宇宙的「黑暗森林法则」。简言之,是高级文明在发现任何一个其它文明存在迹象的时候,都会选择消灭它。这个结论是怎么推论来的,不重要。重要的是,对于书里面的设定,这个结论是「合乎逻辑」的。

因此,当地球即将受到一个高级文明攻击的时候,主人公便威胁他们:「如果你们不停手,我会把你们星球的位置暴露给其它文明,那么你们就会被其它更高级的文明所摧毁。」最终,证明这个威胁是有效的,地球和那个文明在很长一段时间内维持了和平。主人公罗辑靠逻辑拯救了地球。

为什么?因为只要「黑暗森林法则」是由严谨的逻辑推论出来的,同时又因为「逻辑」这个东西放诸四海都一样有效,所以,更高级的文明极大概率也早已推论出了黑暗森林法则。

换句人话来说:只要我们知道了一个确实经得起逻辑推敲的结论,那么远远比我们考虑的更全面更深远的人,多半是会在这件事上面有共识的。

像是百度、抖音这种在其核心系统,已经做到相对而言非常成熟水平的公司,他们在大方向上自然是已经趋于「完美」的。

所以,我们不一定需要去设法「直接」了解具体百度、抖音是怎么做的,而是可以「间接」的通过逻辑等工具去揣测什么样才是完美的解决方案。这两种手段最终的效果往往是差不多的,而后者的可行性通常要强得多。


先举一个百度上面的例子吧。搜索引擎可以如何通过尽少的数据指标,来判断一个网页的质量?

在你阅读后文之前,我认为这是一个蛮值得先停下来进行思索的问题。

过去多年里面,SEO从业者对于这个问题给出的最常见答案是两个:

1) PageRank

2) 跳出率


PageRank,是看一个网页是否有被其它网页通过链接的形式所推荐。若展开说可以说出许多PageRank的局限性,此处跳过。最关键的地方在于,它终究只是一个「过程性」的数据指标。和最终用户对于搜索结果的满意程度指标,还差了很远的距离。

有些SEO从业者,或许还会因为自己觉得「跳出率」指标比「PageRank」指标更重要,从而觉得自己专业水平更高。如果那样想,就是荒谬至极了。


「公理」级别的搜索引擎排序原则是:

设法让尽多的用户,在尽短的时间内找到可以满足自己需求的搜索结果。

如果连公理都没想明白,后面的一切都是无从展开的。哪怕偶尔做出效果,恐怕也只是运气的加持。


比方说,你搜索某个明星的身高,一个搜索结果网页上明确的告诉你答案了,你看到这个答案后,迅速的关闭了被打开的网页。这时候,跳出率是100%,但哪有存在任何问题吗?

如果你没有跳出,还继续访问了网站上面其它的网页,在一部分情况下反而可能说明,你的搜索需求或许没有被直接满足,还在花费更多时间去找想要的东西。所以,跳出率在个别情况下,甚至是和网页质量呈现负相关的,没理由被百度当做核心指标(而且百度怎么去全面收集第三方网站的跳出率也是个问题)。

所以,百度该看什么指标呢?这两年,不少从业者可能给出的一个答案是,看用户在搜索结果页面上面,对于每一个搜索结果的点击率。

但这里的问题也非常明显。确实,用户都不乐意点的搜索结果,自然多半是不那么高质量的;但平常大家都是用过搜索引擎的,应该清楚,当点击了一条搜索结果以后,也经常会觉得这并不是自己想要的,然后又退出来打开其他搜索结果。所以,单纯的点击行为,并没法全面的说明问题。

其实最终答案已经提到了。理论上接近完美的解决方案正是,去看用户点击了当前的搜索结果之后,是否还会退回百度去点击其它搜索结果;如果点击了当前搜索结果之后,就把百度关闭了,那这就是大概率是一次满意的搜索行为。

得到这样的猜想之后,还可以设法去收集数据来验证。既然我在这里写这个东西,自然是实际数据验证过的。


但其实,用数据去验证猜想这一步,在不少情况下甚至是可有可无的。道理就是前面说的,只要我们的结论逻辑上是足够经得起推敲的,百度做了十几年的搜索引擎还没想到这一点的可能性是几乎不存在的。

这也正是逻辑工具的一个强大之处所在——通过实践去验证,通过数据去验证,尽管在很多场景下仍然是更好的选择,但在另一些场景下,因为实验、数据收集都有时间、技术等方面的难题,会使得这些手段变得极为低效,难以获得研究成果上的质变。

唯有逻辑,只需要我们的大脑。


在进入抖音的话题之前,还是先来再谈个外卖的排序研究。几年前有个小伙伴和我说她可能要去和人合伙做外卖创业了,花了不到一个小时简单给看了下。具体看的是哪一家外卖平台的我给忘了。

这是一个可能更容易被理解的简单统计为主的粗浅研究,但仍有非常直接有效的用途。


首先,我们总是应该通过各种方式,把能确定的东西尽可能的确定下来,之后再去做未知部分的探索。比方说搜索引擎,能确定的东西很大一部分来自于搜索引擎原理书籍、百度官方搜索资源平台的文章、百度专利……当然,还有在无论任何领域都通用的——常识。

常识告诉我们,外卖的配送距离或是时间,一定是排序影响最大的因素之一。

其次,常识也能告诉我们,口味的评分、销量等一些和用户反馈相关的数据指标,也较有可能是会影响排序先后的。

随后,收集具体的排序结果,及对应的数据指标。


如果一家店,前面几个指标表现都良好,排名也不错,就视为正常结果。反之,如果排名不错,但主要指标都不佳的那些排序结果,则是主要需要分析的部分。

只要分析到这些结果的共性(且同时差异于正常结果的),便基本上是真正对排名有影响的地方。

第一个额外排序因素很快就被发掘到了,新店。对于新开的店,外卖平台会先流量扶持一阵。但这个排序因素可操作性不强,并非我关注的重点。

刨除掉新店影响后,继续分析剩余那些排名异常的店家的共性,发现了那些商家的图片,大多数都是品牌LOGO,而这些商家都使用了菜品的图片。大部分场景下,商品图片的CTR都明显高于品牌LOGO,因此基本可以断定,点击率或受到点击率影响的其它指标,是一个重要的排序因素。


也因此,外卖排名谈什么刷单、好评返现刷评分等等极其高成本的操作之前,哪怕花几分钟把商家图片从品牌LOGO换成菜品,订单量也能大幅提升。

是不是听上去蛮有意思的?


相比起研究了早就超过10000小时的搜索引擎,抖音我到现在不过研究了最多十几二十个小时。于是能写的东西,相对浅薄许多。

首先,我第一步仍然是在统计的方向进行了探索。得出的结论是,如果单纯的横向对比同一个发布者的视频,这时评论÷获赞比例、转发÷获赞比例这般的指标,整体上和获赞量没有呈现明显的正相关,甚至在个别专业领域下,它们有时是呈现出负相关的。类似的,从其它方式收集到的一些个例来看,甚至在横向对比同一个发布者的视频时,完播率(完整看完整个视频的比率)和播放量之间也没有比较必然的联系。

这两天粗看了一本推荐系统原理方面的书籍。期间,有想到一个可能比较重要的思想实验:

假设抖音推送了一条超级美女的视频,那么可以想象,男人都是大猪蹄子,看完的可能性很大;而且女性通常天性上也会欣赏美女,因为有代入感(反过来男性不那么会欣赏帅哥),看完的可能性也不小。

鉴于大众对于美女的喜爱,以及这类视频在整个平台里面几乎算时长最短的类型。这时,这些视频的完播率很可能是很高的。

而且,抖音这种大型平台里面不乏超级美女(和强大的美颜功能或多或少有关系),它可以不断的推送这样的视频。如果这样,用户在线时长在短期内可以达到很大的提升。

但这样的话,用户花不了多久就会发现全都只是这一类视频,渐渐觉得抖音内容过于缺乏多样性。再怎么样的美女看多还是会看腻,用户就逐渐流失。因此抖音必然是要么存在一个机制,天生就使得这一类(或类似)视频不会过度爆火,要么是额外存在着一个抑制机制。


同时,在刷抖音的实际过程里面不难发现的是,每一类自己感兴趣的领域,刷到的视频数量总体上是相对平均的。很少会连续拼命推送同一类型的视频。

对于以上两个现象,不难得到一种猜想:抖音根据每个用户的喜好程度,给TA推送相应数量比例的那些个「类别」的视频。一些质量数据指标,只需要在特定类别里面有相对的领先就够了。


如果上述猜想是正确的,那么如何从抖音获得更高的推送量?

答案就是,把自己的视频蹭到有更多用户关注的类别里面去,也就是「蹭热点」。

似乎像是说了一句废话,因为稍微认真做过抖音的人,应该都知道蹭热点可以获得更多播放量,看上去没有什么技术含量可言。


比如有一个抖音号叫做「大能」,主要是讲玩表的话题,抖音至今才做了不到两个月,已经有了将近700万的粉丝。玩表是非常小众的领域,但他的视频仍然经常能有几十万的获赞,不乏偶尔爆出个百万级别获赞的视频。其中的主要原因之一就是他喜欢蹭热点。

他获赞最多的视频将近两百万,那个视频在罗志祥成为话题人物的期间,讲的是「罗志祥戴的是什么表」。大家都乐意八卦一下渣男的奢侈生活,于是在原本玩表的话题上面,完美的顺势蹭到了一波热点。但显而易见的是,这种「完美顺势蹭热点」的机会是可遇不可求的,并且对文案创作有较高的要求。

这些天,他又蹭了一个热点,视频里面讲「隐秘的角落」这个时下大红大火的电视剧,又收获了几十万的获赞。但这个视频讲的主要是他对于这部电视剧的感想,和玩表的话题完全无关,因此新增的粉丝肯定是不精准的。这种蹭热点,完全就属于是「强蹭热点」,肯定不能说毫无作用,但相对而言会收益有限。


「完美顺势蹭热点」的收益巨大但前提条件较为苛刻,「强蹭热点」没什么前提条件但收益较小。因此一个更具研究价值的方向,就是去寻找那些既容易实现,又收益更高的办法。


首先,应该先明白抖音大体上是如何判断一个视频的所属类别的,这是我们去蹭别的类别的前提。「类别」这个东西可不是普通人直觉上那么简单的东西,远远不是随便把一个视频归属到一个类目这么简单。在机器学习的领域,它主要是「分类」和「聚类」两大块,根据目前的分析,抖音多半是以聚类为主导的。但聚类对于没有机器学习相关经验的人,却又难以三言两语描述清楚,这里无从展开。

其次,也应该要明白一个根本矛盾——蹭一个不是很相关的类别的同时,因为播放量被抖音分发给了对视频没直接兴趣的用户,很容易会把视频的质量数据指标拉低,反而导致抖音不乐意后续再分发更多用户过来。

所以,如何在不显著影响质量数据指标的同时,蹭到抖音其它类别/热点的流量,是现阶段我的主要研究方向之一。已经有了个别的侧面佐证,正在设法实际验证。而这里,就留个悬念了。

1.明智云遵循行业规范,任何转载的稿件都会明确标注作者和来源。
2.明智云的原创文章,请转载时务必注明文章作者和"来源:明智云",不尊重原创的行为或将追究责任。