配置Pycharm的Scrapy爬蟲Spider子類通用模闆

2021-11-22 23:50:00

Scrapy爬蟲的模闆比較單一，每次建立爬蟲程式要麼重新手敲一遍，要麼複制粘貼

從頭手敲：效率較低，容易出錯，浪費時間
複制粘貼：老代碼需要改動的地方較多，容易漏掉，導緻出錯

是以，pycharm中配置一個模闆檔案就很重要了

# -*- encoding: utf-8 -*-

"""
@Date    : ${YEAR}-${MONTH}-${DAY}
@Author  : Peng Shiyu


"""

from scrapy import Spider, Request, cmdline


class XXXSpider(Spider):
    name = "${NAME}"

    start_urls = []
    
    def start_request(self):
        for url in self.start_urls:
            yield Request(url)
        
    def parse(self, response):
        pass

if __name__ == "__main__":
    cmdline.execute("scrapy crawl ${NAME}".split())

資料采集 Python python資料 python資料框大資料python python資料解析 python指定資料

上一篇: Can't connect to local MySQL server through socket '/tmp/mysql.sock'

下一篇: Python程式設計：zope.interface實作接口安裝代碼示例

配置Pycharm的Scrapy爬蟲Spider子類通用模闆

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入