天天看点

如何解决网站源码(加密混淆)没有信息也能正确的抓取信息?如何利用electron抓取网站信息?爬虫

如何解决网站源码(加密混淆)没有信息也能正确的抓取信息?如何利用electron抓取网站信息?爬虫

      • 首先我们来安装electron,本节课暂不演示electron的安装了,有兴趣的同学可以自己试一试。
      • 下载electron-quick-start
      • 启动项目
      • 修改index.html页面
      • 创建test.js并修改
      • 修改main.js
      • 附带几张效果截图

传统的爬虫技术大部分都是通过源代码来获取页面内容,但现在随着社会的发展很多html代码都是动态渲染,渲染逻辑都是在js里处理了。前端的打包编译混淆之后,源码基本连自己都看不懂,更别说去解析源码。如下图后台管理

如何解决网站源码(加密混淆)没有信息也能正确的抓取信息?如何利用electron抓取网站信息?爬虫