联系我们

泰言工作室

1260344252

15711147576

taiyanseo@foxmail.com

抖音最新日活超3.2亿 字节跳动资深算法架构师深度剖析抖音推荐机制!|刘德华抖音直播

发布者:taiyanseo发布时间:2022-01-31访问量:95
抖音营销
抖音最新日活超3.2亿 字节跳动资深算法架构师深度剖析抖音推荐机制!

近日,字节跳动发布了最新数据,比前几天新版微信吸引了更多关注:抖音日活突破3.2亿,字节跳动产品日活总量突破7亿,全球月活突破15亿。抖音官方海报抖音用户本文由新哈佛教育培训打造,主要讲解抖音,超3.2亿的最新日活,以及字节跳动资深算法架构师对抖音推荐机制的深度解剖!预计阅读时间6分钟,共2335字。让我们一起来看看新哈佛教育培训的介绍,希望对大家有所帮助!

近日,字节跳动发布了最新数据,比前几天新版微信吸引了更多关注:抖音日活突破3.2亿,字节跳动产品日活总量突破7亿,全球月活突破15亿。

抖音官方海报

抖音用户增长图

众所周知,抖音的成功离不开字节跳动独特的算法机制。

网上流传着很多抖音的推荐机制,乱七八糟,真假难辨。

7月9-10日,在“2020WISE超级进化者”大会上,字节跳动资深算法架构师曹欢欢给出了关于推荐机制的正确答案。

了解这个算法机制,也许离百万爆款视频不远了。

以下是嘉宾演讲记录:

今天就和大家分享算法推荐如何帮助用户拓展兴趣。

很多朋友看到这个话题,都觉得有点意外。由于算法推荐是一个新生事物,近年来得到了广泛的应用。有一个规律,一个新事物会有一些误解,因为外面很多人对它了解不够。

关于算法推荐有一个常见的误区。有人认为算法推荐缩小了用户的兴趣。这背后的逻辑是算法推荐很了解你,只根据你的兴趣推荐推荐用户感兴趣的东西,用户看到的内容总是在有限的范围内。时间长了,用了几年的推荐系统,你的知识、见识、见解都不会提高。

为什么这是个误会?这种想法是因为很多人对算法工程师不了解,对算法推荐系统了解不够。

智能算法工程师不希望自己的用户兴趣缩小,就像商场没有店长一样,他希望顾客每次来商场都关注同一个品类的产品。店长希望顾客关注尽可能多的产品品类,算法工程师也希望用户尽可能扩大兴趣。

1.推荐系统必须是智能且可学习的。

本质上,推荐系统必须基于海量的内容,即必须有更多的内容。如果只有十条,就没有办法推荐了。内容很多,不知道你喜欢哪一个,让系统来做,可以节省用户的精力和时间。

从海量的内容中选择用户感兴趣的内容,那么推荐系统一定是一个智能的、可学习的系统,它会根据用户的反馈进行自我调整。有很多反馈,比如在电商领域下单加购物车,在内容领域点击,在短视频领域播放。

推荐系统通过各种正反馈不断观察和学习,并根据这些信号不断调整自己,使其更好地满足用户的兴趣和需求。这就是推荐系统的本质。

在行业内最早应用推荐系统的行业是电影。

早在2006年,当时还在卖DVD的网飞,曾经发起过一次奖金高达百万美元的比赛。比赛的内容是谁能发明出比他现有的电影推荐算法好10%的方法,谁就能得到一百万美元。

推荐系统在信息领域的应用其实比较晚,今天的头条应该是全球第一。我加入了标题

早些时候,像谷歌这样的读者要求用户以繁琐的方式订阅一堆来源或标签。全面实现系统自动学习推荐。今天的头条是世界第一。

不同行业的推荐系统虽然应用领域和场景不同,但本质上是相似的。

所有推荐系统都需要依赖三个特征:内容特征、用户特征和环境特征,系统需要结合这三个信息进行决策。

用户特征是指用户。

的标签,包括用户注册时提交的基本信息,比如性别、年龄,还有用户在平台上的动作,比如用户历史点击的文章列表抖音引流、文章的关键词分布、文章的作者分布等信息。

内容特征,如果它是个商品,要有分类、标签,包括历史购买评论,这些都很重要。对于内容来讲,就是它的文本、主题、关键词等信息。

环境特征,就是环境信息,对于用户来讲,他的兴趣很多时候会变化,有的会周期性变化。比如一个资讯APP用户,上班期间和上班路上、下班休息的时候,兴趣是有变化的。

这些特征信息推荐系统是要考虑到的。但是在不同领域、不同的推荐系统考虑的侧重点有所区别。总体来讲,所有的推荐系统都必须基于这三方面的信息来决策。

应该还没有一个系统,用这三方面之外的特征信息,所以这个概括还是比较全面的。

2、推荐内容多样性越好

用户长期留存概率越大

大家对推荐系统的基本概念了解之后,可能会想到一个问题,作为推荐系统的开发者,是怎么设计推荐系统的,推荐系统的目标是什么?

从推荐系统设计者和运营者有不同层次的目标,有短期目标、中期目标、长期目标。

长期目标。运营一个业务,希望提升用户的长期黏性,希望用户用了今日头条等应用之后,能一直用下去,成为我们的忠实用户。一方面用户体验很好,它才会长期用。

从企业来讲,长期的收入就有了保障,这肯定是长期目标。长期目标对于算法、模型来讲是非常难学的。越是长期抖音搜索推广案例目标,机器学习难度越大。

所以又有一些中期目标,比如用户下周或者下月还来用。在短期窗口内提高它的黏性,这也很难,但是业内也有一些探索,比如强化学习的学习范式,而不用监督学习。但是也比较难,目前还不是特别成熟。

技术最成熟的是短期目标,短期目标就是用户短时间内对用户的反馈。给用户推了一篇文章,用户有没有点开、点赞。抖音推的短视频,有没有播放、点赞、分享。这些短期目标模型是非常容易学习,容易建立起用户行为。

短期目标和长期目标的关系,有正相关性,又不能完全用短期目标代替长期目标。根据我们的观察发现,推荐内容的多样性越好,用户的长期留存概率越大。

如果只是推高热内容,用户短时间也点击,也停留了,今天看了也很爽。但是内容的多样性不好,很单一,用户的长期留存就很差。

这和我上面提到的商场的类比一样。一个喜欢鞋子的用户,假如每次来商场都能快速买到自己喜欢的鞋子,用户的单次消费就很开心,但最终用户会减少来这个商场的消费次数,除非他又产生了买鞋子的需求。

要把用户长期留存下来,就要穿透他的兴趣,拓展他的视野,让他衣服、饮食、看电影这些消费,都在商场里完成。

所以从推荐系统设计者来讲,非常希望推荐系统既短期数据有很好的表现,也希望推的内容是多样化的,能满足用户多个兴趣点。

甚至我们需要挖掘用户更多的兴趣点,尽量在一个平台上满足用户更多的兴趣点。所以做内容的多样性,也是抖音创始人我们的需要。

头条在资讯推荐领域算是先行者,这块也积累了很多经验。如果大家是头条的老用户,应该会发现,看到的内容是非常多样化的。

3、推荐系统如何探索更多用户兴趣

那么接下来说说我们在推荐系统里是如何做到探索用户更多的兴趣方向,并且避免内容推荐的过于单一的。

从策略上讲,推荐系统会有消重和打散策略。

所有的内容在推荐之前,会进行各种层次的相似性分析,会识别哪两篇文章或者视频是非常类似的。比如可能两篇文章,虽然遣词造句不一样,但是讲的内容是一样的。

推荐系统能够分析哪些文章讲的是同一个事情,或者涉及到同一个人,或者涉及到某一个公司,基于他们各种各样的特征进行分析。

然后,推荐的时候,系统会根据不同的相似性对这些相关的文章进行不同的处理。对于相似的文章,如果给用户推荐了文章A,跟文章A相似的其他文章就不会被推荐了,这个就是消重的策略。

那么还有一种情况,就是同一个方向或同一类主题的文章,比如都是足球的文章,推荐系统就需要打散策略,来保证推荐的频率不会太高,避免用户在前端感觉内容的同质化,保证内容多样性,这些都是有算法保证的。

除了消重和打散策略,我们还会留一部分比例流量,探索用户的兴趣。

甚至,我们会牺牲短期目标,比如每几刷,或有一刷的位置就是探索用户的兴趣,推荐一些模型不确认用户是不是感兴趣,但是模型想探索一下,会有一些这样的流量。

然后就是从推荐模型本身来讲,最古老的推荐模型是协同过滤,这是十几年前的老一代技术,那时候大家就已经在考虑拓展用户的兴趣了。因为给用户推一样的东西,用户肯定会流失。

协同过滤的做法也非常简单、直观,推荐系统会考虑你跟哪个用户比较像,你们都点了什么,你们喜欢同一类的电影,然后把那个人看过的,但你还没看过的内容推荐给你,通过相似用户的手段实现了兴趣的探索。

现在还有很多高端技术也在探索用户兴趣,推动内容多样性。现在主流的技术是用深度学习做推荐,在深度学习里面有很多方法,包括网络可以做一些特殊的设置,让它学一些新东西。

深度学习还是比较容易做的,因为所有用户、所有内容都是高维空间的向量,可以有意识引导模型,让它学习一些可能感兴趣的内容,虽然它的兴趣标签和你不一样。

但是在这个空间里面,映射到很近的点,让模型容易推出去,这里面有很多高端的做法。

最后还有一个重要的手段,我们给用户推出的是一个APP,是一个完整产品。很多人担忧推荐算法,就算你有这么多手段,还是不能很好测量我的兴趣,不能探索出我的更多兴趣。

作为产品来讲,它有很多功能,比如今日头条,我们也做了很多功能来帮助大家拓展兴趣。

比如热点,包括地震类的重要新闻,以及其他类的小众热点新闻,我们也会直接推荐给大家,我们会做很多精美的专题,背后有很多运营团队去做。

比如关注,过去两年,我们在UGC也重点发力,也做得非常好,涵盖了基本上各个行业的名人、大V。

抖音直播带货怎么做?抖音直播带货有什么技巧?抖音直播带货靠谱吗?抖音直播间的货是真是假?抖音直播运营方案,抖音直播产品运营思路?