HI . 我是乐猫 , 目前在实现财务自由的路上狂奔。
最近在做微信公众号时,我发现很多人都会遇到同样的问题:找到对标博主账号之后,却不知道该怎么获取他们的历史文章。为此我尝试了不少方法,最后发现其实可以借助微信读书,比较高效地实现博主文章的批量下载。
先聊聊实现思路:
具体的做法是,我先在手机端下载微信读书 APP,然后通过“添加书架”的方式,把目标博主的文章放进书架里,其实这个时候放进去的并不是单篇文章,而是整个博主账号的信息。接着在 PC 端打开微信读书网页版,只需要获取登录后的 cookie,就可以通过接口的方式批量抓取内容。我这一步是借助 Coze 来实现的,最后再把获取到的文章内容写入飞书多维表格中,方便后续整理和分析。
不过我的实现方法和飞书多维表格有大量交互,整个流程会显得有些繁琐,大家可以先当作一种思路参考,再根据自己的需求去做精简或优化。
飞书多维表格
在整个流程中,我把飞书当作数据仓库和触发入口来使用。为了方便管理,我建立了几张不同的表,包括书架信息表、文章信息表、配置表以及运行状态表,同时还设计了两个按钮来触发自动化流程。通过这样的设置,既能集中存储数据,又能一键触发操作,整体流程会更直观清晰。接下来我就具体介绍一下它们各自的作用。
书架信息
书架信息表的作用,就是把微信读书中的书架数据拉取下来,并存入飞书表格中。这样做的好处是,可以把目标博主的账号信息先整理好,方便后续再去批量获取对应的公众号文章内容。

文章信息表
文章信息表的作用很好理解,就是用来保存作者的文章内容和相关信息,把抓取到的公众号文章统一存放在这里,便于后续的整理、分析和调用。

配置表
配置表的作用,是用来存放整个流程所需的基础数据。在这里需要严格按照预先设定好的字段来创建,不能随意增删或修改。这样做的目的,是为了在调用工作流时只需传递最少的参数,从而让整个调用过程更简洁高效。

运行状态表
在飞书表单中使用 HTTP 请求时,有一个限制,就是请求必须在 60 秒内完成。但在实际操作中,我们的请求往往会超过 60 秒,这也就意味着无法立即获取返回结果。因此,这里的设计目的主要是为了承接最终的处理结果,而不是追求实时响应。同时,最常见的问题就是 cookie 的有效期会过期失效,这也是在使用过程中需要重点关注和处理的地方。

为了更好的阅读体验,来飞书看吧:
https://mcn7oy4f0b0e.feishu.cn/wiki/LqPXwW8TBiLphzkOotCcOISlnGf
Comments on "下载公众号博主的文章" :