我们在做YouTube的时候下意识的会把国内的一些玩法放到YouTube上来,在我看来有种刻舟求剑的想法,我们对YouTube的推荐算法有更好的了解,那么就会少一些自以为是的想法了。

YouTube 的目标:

1、预测观众想看什么

2、最大限度地提高观众的长期参与度和满意度

作为一个平台,油管的目标是以上两点

1、预测观众想看什么

当你访问YouTube,YouTube会根据你的喜好提供视频,目的是让你尽可能长时间地留在平台上,

2、最大限度地提高观众的长期参与度和满意度

通过一组荐算法让你带着一定的满意度离开,推荐算法在后面会详细解释

如何做到这一点 ?

1、收集和使用数据

2、一组算法

YouTube是如何实现这两个目标的呢?方法其实很简单,就是通过收集和使用数据。

它需要知己知彼,既要了解用户的数据,也要掌握视频的数据,然后在中间进行匹配,在一些教程中,所谓的养号是养用户端的,对于视频的生产端不会有直接的关联的。这个点很多人搞不清楚。

有了这些数据后,油管会通过一组算法(注意,是一组算法,而不是单一算法)来实现这一目标。

YouTube 每天从用户行为中收集800 亿个数据点

1、用户观看哪些视频

2、他们跳过哪些视频

3、他们看了多长时间

4、喜欢或不喜欢

5、不感兴趣”反馈

6、观看视频后的调查

7、重新观看/继续观看/稍后观看

这里说的【YouTube 每天从用户行为中收集800 亿个数据点】 是之前公开的数据,到现在2025年,只会更多,具体多少大家就不要纠结了。

YouTube收集的数据量非常庞大。它不仅收集你在平台上的每一个动作,还包括其他用户的所有有价值的行为数据。

比如,你观看了哪些视频,跳过了哪些视频,每个视频观看了多长时间,是否喜欢或不喜欢某个视频,甚至你是否明确告诉油管不再推荐某类视频或某个频道。

你可能会注意到,油管经常会在你观看视频后弹出一个小调查表,询问你对刚刚观看的视频的反馈。这就是所谓的观看后调查。此外,油管还会关注你是否重新观看某个视频,是否在观看一半后离开,比如去上班,然后晚上回来继续观看。

还有一个重要的行为是“稍后观看”。当你看到一个视频但没有时间立即观看时,你可以将其添加到“稍后观看”播放列表中,这实际上相当于收藏。

油管会跟踪你是否真的回去观看了这些视频,还是只是保存后就不再理会。所有这些用户行为,油管都在持续收集和分析。

根据我自身的体会,如果你长时间刷某一个领域的视频,那么你的首页就会出现非常多相关的视频,同样的你养号只是会让你刷到你要看的视频,并不会对你做的视频会怎么样,不是说你养了号,你做的视频就有播放量,这两者无直接关联。

收集元数据

1、封面/缩略图:cloud vision 图像识别/安全评级,可以单独使用

2、视频:扫描每一帧,记录重要信息

3、字幕:自动/手工(可能不是人声),匹配视频中的信息

4、语音:不一定跟字幕同步

5、标题/说明:很多人忽视说明

这里列举的只是部分重要的用户行为,实际上油管收集的数据远不止这些。那么,在视频方面,它具体会收集哪些信息呢?前面我们主要讨论了用户数据,现在让我们来看看视频数据。

视频有一个叫做“元数据”的概念。什么是元数据呢?这个技术术语指的是“关于数据的数据”,即用来描述数据的数据。通常,一个视频最重要的元数据包括封面、标题、说明、字幕等,这些都是视频文件之外的信息,用来描述视频本身。

那么,油管会收集哪些元数据呢?首先是封面或缩略图。

这里用到了一个特别的技术,叫做“Cloud Vision”,中文可以勉强翻译为“云视图”或“云端视觉技术”。

简单来说,这是一种在云端进行图像识别的技术。通过扫描图片内容,它可以识别出一些不恰当的内容,比如少儿不宜、宣传仇恨、枪支、香烟、酒精等。同时,它还会对这些内容进行安全评级。

需要注意的是,Cloud Vision 技术可以单独使用,不一定要与油管绑定。

为了更好的阅读体验,来飞书看吧:

https://rlwxa0zgke.feishu.cn/docx/KEKzdOzAco3rV5xcVi2cQ2GCnXd

Comments on "YouTube算法解析​" :

Leave a Reply

Your email address will not be published. Required fields are marked *

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源