产品视角看推荐算法
对于一个产品而言,推荐算法不是万能药。在红利期智能推荐算法可以作为产品的噱头,但当先发优势已经不复存在的时候,比如当下,几乎每一个做内容的产品,背后多多少少都有算法。在这个基础上,推荐对产品本身的提升是有限的。有限是说,确实有明显的提升,但不是那种没有就活不下去,或者有了就比其他产品NB很多的那种提升。我们使用微博,是因为他的饭圈和快速实时的新闻;使用B站,是因为它的内容优秀和社区文化;使用微信,是因为社交关系。这些产品最主打的核心竞争力都不是算法。
相应地,机器学习也不是万能药。机器学习只适合用来解决和优化目标明确的事情。当业务目标本身都不太能够用简练的语言描述清楚的时候,这意味着目标本身是不太好定义的,这类目标用机器学习都是不太容易搞定的。比如我们要鼓励原创生态,这个目标用机器学习就不容易搞定;需要把这个目标具体细化到某一个领域,定好标准,标好样本,机器学习才能发挥作用。
对于产品而言,还是需要打磨产品自身。从用户的角度,更加用户友好的界面,主要是UI和产品逻辑,产品自身的定位以及由此引导的社区氛围的构建等等;从作者的角度,更加好用的编辑器,更快更有效的作者反馈处理等等。
当然,推荐算法作为内容输出的模块,与产品本身的关系也是密切的。
一般而言,对于一个以内容为主的应用,推荐系统可以干什么事情呢?我个人总结了以下几点:
更有效率的内容分发
拆成用户角度和作者角度两个方面来说
用户角度
推荐系统可以帮助用户找到自己喜欢的内容。用户不需要复杂的操作就可以找到自己想要的内容,这也是推荐系产品最为迷人的地方。互联网信息从黄页,到搜索引擎,到推荐的趋势,本质是用户主动行为的减少。相比于搜索,用户需要在搜索框内输入一个文字来表明兴趣,现在用户只需要通过大拇指的刷和点,就可以匹配到自己的兴趣,这一点实在是太NB了。
当推荐系统的候选集足够大的时候,用户可以在他自己感兴趣的领域浏览足够多的内容,获得足够多的快感,因为每一个都是他可能会喜欢的内容。
减少了用户多浏览信息的成本,变相也就提高了用户的停留时长。实际上这也是为什么推荐系的产品都有“kill time”的美誉。
作者角度
从作者的角度出发,推荐系统的作用就是帮助作者更高效的触达潜在的受众。
以前作者生产出来的内容,需要专门的宣发机构,比如报纸杂志去承载;以博客为代表的那一代内容生产商,实际上是借助搜索引擎的力量,实现了内容直接生产,而不需要投稿到某一个专门的宣发机构,导致了媒体行业的下滑;而以微信公众号为代表的移动端订阅制,绕过的搜索引擎,实际上是更加方便了内容的触达,他干掉的是博客时代的邮箱订阅系统,同时也把内容生产普及到了更多的受众上。但是订阅制有个问题是,成为大V的阶梯有点过于陡峭了:野蛮生长时代的作者们成长速度可能很快。但还有很多晚入场的内容生产者,他们如果想要成为大V,可能需要花费更多的时间。
在推荐系统场景下这一切有什么变化呢?对于作者来说,名义上,推荐系统可以帮助他们触达他们更多的潜在受众。但其实作者关心的只有一个数值,就是量。
推荐系统的好处是,可以帮助那些低粉但优质的内容生产者,可以快速的有量,这样可以快速孵化一批优质的原创作者;相当于对作者传达了,在推荐系统的场景下,你和大V是平等的:只要你生产的是好内容,那你就有起量的可能。此外,越来越多的用户的时间被推荐系统的产品挤占,产品提供给作者的想象空间都是作者希望看到的。
但潜在的风险是,对于大V来说,流量不是那么的稳定。流量稳定直接决定了大V们的收入:比如作者接了商单单发视频,可能就会因为推荐系统的反馈,使得流量显著低于他的正常的视频。大V们可能会觉得,自己辛苦半天,培养了很多粉丝,如果没有理想的商业变现,啥也不是。所以对于大V来说,他们可能会更偏好订阅为主要分发场景的场景,比如B站。
内容生态的控制
什么东西不能推
一个理想的推荐算法模型,拟合的其实是人性。但用户喜欢点的,往往是一些色情低俗的,猎奇的内容,此外用户还会有越是不让看的东西越想看的逆反心理,平台如果纵容这些不管,早晚会违法乱纪。这些东西理论上不是内容分发侧的推荐算法可以解决的,而需要专门的人来解决。这就是审核。
因为审核的case千奇百怪层出不穷,历史的badcase可能会在新时代焕发出新生命,以一个新的姿态呈现在你的面前,这意味着模型很难通过历史数据的学习干掉所有的badcase。所以审核需要人工审核。审核模型在其中可以起到节省人力的作用——拿不准的东西再交给人审。
什么东西多推,什么东西少推
作为一个内容分发模块,推荐是有这样的决定权的。要达到这个效果,除了基础的模型要做对的情况下,还要科学的做这件事。在推荐算法的同学眼中,唯一可以依赖的,只有用户的行为。推荐系统控制画风的策略是:要在拟合准确用户行为的基础上,通过用户行为目标的权重的控制,达到多推某些内容而少推某些内容。
当然从产品和运营的角度来说,科学的东西不一定是产品和运营所期望的。一是因为科学的拟合人性可能会因为前面提到的,人性天生喜欢猎奇或者低俗的东西而带偏;二是内容分发作为产品和用户交互的重要部分,是需要承载烙印产品在用户心目中的产品形象这个任务的。比方说,如果内容只推用户喜欢的影视拆条,无论UI做的多目高大上,那么在用户心目中,这个产品就是用来看影视拆条的,如果用户喜欢看新的,有趣的视频就不会来这里了。此外,对于大多数作者而言,采取的创作战略都是有样学样。如果平台上大部分都是搬运,那新作者入场的时候,大概率也是会以搬运入场。久而久之,产品自身的内容生态就被确定了,在用户心目中的定位也就已经确定了。
所以我们需要给产品和运营一些流量分配的权利。但这其中也有trade-off。因为不干预的纯模型结构,理论上是指标最好看的;干预了就有效果的损失。所以就存在我们要用多少的效果指标损失来做干预这件事儿。这里的决断一般靠两点: 一是看目标人群上的指标变化,可能全局掉了但目标人群涨了,这个可能还比较符合产品预期;二就是信仰方法论了。
多说一句,内容的社会责任
当产品体量较小的时候,我们可能会比较care指标和产品调性。当产品dau和时长不断增长,已经变成日常百姓生活中不可缺少的部分的时候,是需要承担一部分社会责任的。推荐作为内容的出口,需要考虑正能量、对人更有用、能够产生更多正面影响的内容,而减少分发一些负面情绪、或者不良内容的传播,让整个社会的参与者的幸福提高。
这是企业的社会责任。能力越强,责任越大。
版权声明: 本文为 InfoQ 作者【峰池】的原创文章。
原文链接:【http://xie.infoq.cn/article/6215629714f8e90dcec92002b】。文章转载请联系作者。
评论