天天看點

<day004>小娜顯示空白+CSV檔案的基本操作+普通的代理使用

小知識:

  當小娜搜尋顯示空白的時候,怎麼解決?

    任務管理器結束小娜程序就好了= =*(多半是慣得,關掉就好了!)

任務1:CSV檔案的基本操作

import csv
import pandas as pd
#寫入csv檔案會出現空行的情況,加入newline
with open('data.csv','w',encoding='utf-8',newline='') as file:
	writer = csv.writer(file,delimiter=' ')
	writer.writerow(['id','name','age'])
	writer.writerows([['1','123','19'],['2','123','19']])
#普通的讀取csv檔案
with open('data.csv','r',encoding='utf-8') as file:
	reader = csv.reader(file)
	for row in reader:
		print(row)
#用pandas的read_csv讀取,會多一個序号列
df = pd.read_csv('data.csv')
print(df)
      

  

任務2:代理池(還沒學會)

'''
代理池
	存儲子產品:存儲在redis資料庫的Sorted Set(有序存儲)--能保證不重複
	擷取子產品:實時在各大代理網站抓取代理,存儲形式(IP:PORT),優先高匿代理
	檢測子產品:定時檢測資料庫中的代理,爬取哪個網站就檢測哪個網站,100分表示可用,
			檢測一次可用分數+1,不可用分數-1,低于某個值直接從資料庫删除
			思路2:可用即置為100,100為最大,失敗一次-1,成功一次置為100
	接口子產品:需要用API提供對外接口,提供一個web api接口,避免去資料庫找的繁瑣,
			通過通路接口獲得可用代理

有點麻煩,暫時沒時間弄,先學個簡單的
免費代理:
	西刺代理:https://www.xicidaili.com/
	快代理:https://www.kuaidaili.com/free/inha/
	小幻HTTP代理:https://ip.ihuan.me/
	89免費代理:http://www.89ip.cn/
	66免費代理:http://www.66ip.cn/
	3366雲代理:http://www.ip3366.net/
'''


import requests

# 根據協定類型,選擇不同的代理
headers = {
	'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36',
}


proxies = {
	"http": "http://112.85.130.143:9999",
	"https": "http://116.209.52.49:9999",
}

response = requests.get("http://www.baidu.com", headers=headers, proxies=proxies)

print(response.text)
      

 

總結:

  今天努力寫論文中,沒怎麼學習python 

  目測接下來三天都以論文為主

day