如何做一個爬蟲

2023-07-15 20:21:16

如何做一個爬蟲

1.首先寫一小段代碼，把網站裡面的東西全部扒出來

2.在根據自己的需求寫代碼，找到自己想要的一部分就可以了

3.首先我們來扒一下縱橫中文網裡面的東西

import urllib.request as req
   import re
   url = 'http://www.zongheng.com/'
   webpage = req.urlopen(url)          # 根據超鍊通路連結的網頁
   data = webpage.read()           # 讀取超鍊網頁位元組資料
   data = data.decode('utf-8')     # byte類型解碼為字元串
   print（data）

如何做一個爬蟲

上面的圖檔就是我通過代碼全部扒下來的，你們可以看看，後面還有很多。

sence = re.findall(r'<p(.*?)</p>', data, re.S)       #找自己想要的段落并提取出來
      print(sence)

如何做一個爬蟲

這就是我扒出來的，代碼很簡單

謝謝！

如何做一個爬蟲

如何做一個爬蟲

繼續閱讀

v2ex的簡單爬蟲

Python漫畫爬蟲開源 66漫畫 AJAX，包含資料庫連接配接，圖檔下載下傳處理

requests子產品進行人人網模拟登陸

Python image.show() 出錯FSPathMakeRef(/Applications/Preview.app) failed with error -43

2023爬蟲學習筆記 -- 多線程操作

M團店鋪評價采集不到問題問題展示：解決方案：

Python爬蟲學習（1）

Python爬蟲學習進階

Python爬蟲（入門+進階）學習筆記 1-2 初識Python爬蟲

Python進階爬蟲——Class1：認識爬蟲

python爬蟲學習筆記-1

python學習之urllib使用小結

NOIp模拟題之肮髒的牧師（桶排序）

一篇文章教你如何在一個月内學會爬取大規模資料

Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗

sort()函數到底是怎樣進行數字排序的