上次爬取了百度圖檔,是分析解決ajax的json的響應的,對于一些網站的常見的資料的爬取,是這次主要内容。
爬取的是豆瓣電影,并儲存到csv格式中
爬取豆瓣是非常的簡單,因為沒有任何反爬的機制
https://movie.douban.com/explore
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiInVGcq5COykDM1YDOlhzYilTZlZjYwMWY3QzYhVjN4cTY5QDM08CX0AzLcNDMxIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjL5M3Lc9CX6MHc0RHaiojIsJye.jpeg)
分析網站
和上次一樣的套路
代碼非常的簡單
如何構造json的url來不斷的周遊
儲存資料,個人認為不需要使用csv内置的子產品
至此爬蟲已經入門了,接下來的文章會詳細講解爬蟲有關知識并不斷提高難度
▼往期精彩回顧▼
爬蟲篇| 爬取百度圖檔(一)
如果學習遇到問題,加毛利微信:maori01(備注:學習交流)
最後,祝有所學習,有所成長
轉發,好看支援一下,感謝