天天看点

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

原文:

视频更新版:批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/留言数mp.weixin.qq.com/s/c-jpCXxUtZpzxTCSx0Fu_w

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

我写了个脚本批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel,以莫言老师的公众号为例,批量音频效果如图。

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

文章内容是html文件,可以用谷歌浏览器打开。

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

html再批量转换成pdf文件。

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

将转换后的pdf再合并成一个pdf文件并生成书签 :

苏生不惑又写了个小工具​mp.weixin.qq.com/s?__biz=MzIyMjg2ODExMA==&mid=2247497248&idx=1&sn=68a704f67fe5f9c869a0e273623aa12f&scene=21#wechat_redirect

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel
批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel
批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

文章下的留言合并在pdf 里,点击左侧文章书签可以跳转到对应文章:

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel
批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel
批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

除了下载文章内容还有文章数据,主要包含文章日期,标题,链接,简介,作者,封面图,是否原创,IP归属地,阅读数,在看数,点赞数和留言数,赞赏数,视频数,音频数等等,我之前抓取过深圳卫健委的公众号数据听说公众号深圳卫健委被网友投诉尺度大,我抓取了所有文章标题和阅读数分析了下,看阅读数都是10万+,厉害了。

批量下载导出公众号文章生成pdf,抓取公众号阅读数据导出excel

继续阅读