天天看點

Python elasticsearch 導入json檔案資料 + 将scrapy爬蟲資料直接存入elasticsearch

1、json檔案資料存入elasticsearch

  • json檔案是從網上爬下來的資料
Python elasticsearch 導入json檔案資料 + 将scrapy爬蟲資料直接存入elasticsearch
  • scrapy 儲存的json格式資料預設Unicode格式編碼,轉utf-8 格式需要在settings裡面加入一條:

2、 将scrapy爬蟲資料直接存入elasticsearch

  • settings.py裡面設定elasticsearch host
  • pipelines.py添加代碼:
    Python elasticsearch 導入json檔案資料 + 将scrapy爬蟲資料直接存入elasticsearch
  • 需要注意在settings.py開啟 ITEM_PIPELINES選項

繼續閱讀