我们在做YouTube的时候下意识的会把国内的一些玩法放到YouTube上来,在我看来有种刻舟求剑的想法,我们对YouTube的推荐算法有更好的了解,那么就会少一些自以为是的想法了。
YouTube 的目标:
1、预测观众想看什么
2、最大限度地提高观众的长期参与度和满意度
作为一个平台,油管的目标是以上两点
1、预测观众想看什么
当你访问YouTube,YouTube会根据你的喜好提供视频,目的是让你尽可能长时间地留在平台上,
2、最大限度地提高观众的长期参与度和满意度
通过一组荐算法让你带着一定的满意度离开,推荐算法在后面会详细解释
如何做到这一点 ?
1、收集和使用数据
2、一组算法
YouTube是如何实现这两个目标的呢?方法其实很简单,就是通过收集和使用数据。
它需要知己知彼,既要了解用户的数据,也要掌握视频的数据,然后在中间进行匹配,在一些教程中,所谓的养号是养用户端的,对于视频的生产端不会有直接的关联的。这个点很多人搞不清楚。
有了这些数据后,油管会通过一组算法(注意,是一组算法,而不是单一算法)来实现这一目标。
YouTube 每天从用户行为中收集800 亿个数据点
1、用户观看哪些视频
2、他们跳过哪些视频
3、他们看了多长时间
4、喜欢或不喜欢
5、不感兴趣”反馈
6、观看视频后的调查
7、重新观看/继续观看/稍后观看
这里说的【YouTube 每天从用户行为中收集800 亿个数据点】 是之前公开的数据,到现在2025年,只会更多,具体多少大家就不要纠结了。
YouTube收集的数据量非常庞大。它不仅收集你在平台上的每一个动作,还包括其他用户的所有有价值的行为数据。
比如,你观看了哪些视频,跳过了哪些视频,每个视频观看了多长时间,是否喜欢或不喜欢某个视频,甚至你是否明确告诉油管不再推荐某类视频或某个频道。
你可能会注意到,油管经常会在你观看视频后弹出一个小调查表,询问你对刚刚观看的视频的反馈。这就是所谓的观看后调查。此外,油管还会关注你是否重新观看某个视频,是否在观看一半后离开,比如去上班,然后晚上回来继续观看。
还有一个重要的行为是“稍后观看”。当你看到一个视频但没有时间立即观看时,你可以将其添加到“稍后观看”播放列表中,这实际上相当于收藏。
油管会跟踪你是否真的回去观看了这些视频,还是只是保存后就不再理会。所有这些用户行为,油管都在持续收集和分析。
根据我自身的体会,如果你长时间刷某一个领域的视频,那么你的首页就会出现非常多相关的视频,同样的你养号只是会让你刷到你要看的视频,并不会对你做的视频会怎么样,不是说你养了号,你做的视频就有播放量,这两者无直接关联。
收集元数据
1、封面/缩略图:cloud vision 图像识别/安全评级,可以单独使用
2、视频:扫描每一帧,记录重要信息
3、字幕:自动/手工(可能不是人声),匹配视频中的信息
4、语音:不一定跟字幕同步
5、标题/说明:很多人忽视说明
这里列举的只是部分重要的用户行为,实际上油管收集的数据远不止这些。那么,在视频方面,它具体会收集哪些信息呢?前面我们主要讨论了用户数据,现在让我们来看看视频数据。
视频有一个叫做“元数据”的概念。什么是元数据呢?这个技术术语指的是“关于数据的数据”,即用来描述数据的数据。通常,一个视频最重要的元数据包括封面、标题、说明、字幕等,这些都是视频文件之外的信息,用来描述视频本身。
那么,油管会收集哪些元数据呢?首先是封面或缩略图。
这里用到了一个特别的技术,叫做“Cloud Vision”,中文可以勉强翻译为“云视图”或“云端视觉技术”。
简单来说,这是一种在云端进行图像识别的技术。通过扫描图片内容,它可以识别出一些不恰当的内容,比如少儿不宜、宣传仇恨、枪支、香烟、酒精等。同时,它还会对这些内容进行安全评级。
需要注意的是,Cloud Vision 技术可以单独使用,不一定要与油管绑定。
为了更好的阅读体验,来飞书看吧:
https://rlwxa0zgke.feishu.cn/docx/KEKzdOzAco3rV5xcVi2cQ2GCnXd
Comments on "YouTube算法解析" :