在使用Selenium抓去網頁的時候，使網頁的滑動條滾動&&解決Selenium抓去資料不完整問題

2023-03-13 04:22:26

在這裡插入代碼片在我們使用爬蟲爬取資料的時候，Selenium是一個很好的工具。Selenium是一個Web的自動化測試工具，最初是為網站自動化測試而開發的，Selenium 可以直接運作在浏覽器上，它支援所有主流的浏覽器（包括PhantomJS這些無界面的浏覽器），可以接收指令，讓浏覽器自動加載頁面，擷取需要的資料，甚至頁面截屏。

在我們抓取資料的時候，可能會經常發現這樣的情況：頁面上明明有60個我們想要的資料，但是我們實際抓取的時候卻僅僅隻有30條或者20條。這是為什麼呢？實際上網站為了提高性能，往往在頁面上隻會展示一部分資料。當我們浏覽完目前的資料的時候，會往下拉動滑動條，這時會發送ajax請求，展現另外一部分。但是我們在抓取的時候網頁沒有下滑，沒有發送請求，是以另外一部分内容沒有抓取到。解決辦法如下：

def  huadong(lists):
    # 滑動條滾動
    # 定義初始的滑動條的位置
    step = 0
    # 想抓取的資料的清單長度
	list_len = len(lists)
	# 計算下滑的高度（0表示不下滑，10000表示在最下邊）
    hua_dong_shu = 10000 // list_len
    step += hua_dong_shu
    # 執行js，使頁面下滑
    js = "var q=document.documentElement.scrollTop={}".format(step)
    self.driver.execute_script(js)

以上為個人見解，如果和您的想法有所出入歡迎留言共同探讨。

在使用Selenium抓去網頁的時候，使網頁的滑動條滾動&&解決Selenium抓去資料不完整問題

繼續閱讀

2023爬蟲學習筆記 -- 多線程操作

M團店鋪評價采集不到問題問題展示：解決方案：

Python爬蟲學習（1）

Python爬蟲學習進階

Python爬蟲（入門+進階）學習筆記 1-2 初識Python爬蟲

Python進階爬蟲——Class1：認識爬蟲

python爬蟲學習筆記-1

python學習之urllib使用小結

NOIp模拟題之肮髒的牧師（桶排序）

一篇文章教你如何在一個月内學會爬取大規模資料

爬取央視網節目單欄目資訊！

Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗

selenium 自動搶課——電子科大自動搶課腳本前言：使用方法：`代碼：

selenium操作cookie

利用Selenium內建TestLink做自動化測試

sort()函數到底是怎樣進行數字排序的

在使用Selenium抓去網頁的時候，使網頁的滑動條滾動&amp;&amp;解決Selenium抓去資料不完整問題

繼續閱讀

在使用Selenium抓去網頁的時候，使網頁的滑動條滾動&&解決Selenium抓去資料不完整問題