Python3-网页爬取-网页抓取汉字转码、多个参数拼接

2023-07-05 08:52:32

#网页抓取汉字转码、多个参数拼接
from urllib import request

#将汉字转成unicode码
from urllib import parse
# base_url='http://www.baidu.com/s?wd='

base_url='http://www.baidu.com/s?wd='
content=input('请输入你要搜索的内容：')

# base_url=base_url+content#当有一个参数时可以，但现实中会有很多参数，此时肯定不适用
qs={
    'wd':content,
    'rsv_sp':1
}
# print(qs)
# print(base_url)
qs=parse.urlencode(qs)
print(qs)
base_url=base_url+qs
headers={
    'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0'

}
req=request.Request(base_url,headers=headers)
response=request.urlopen(req)
html=response.read()
html=html.decode('utf-8')

with open(content+'.html','w',encoding='utf-8') as f:
    f.write(html)

请输入你要搜索的内容：CSDN学院

wd=CSDN%E5%AD%A6%E9%99%A2&rsv_sp=1

Process finished with exit code 0

Python3-网页爬取-网页抓取汉字转码、多个参数拼接

继续阅读

v2ex的简单爬虫

Python漫画爬虫开源 66漫画 AJAX，包含数据库连接，图片下载处理

requests模块进行人人网模拟登陆

Python image.show() 出错FSPathMakeRef(/Applications/Preview.app) failed with error -43

2023爬虫学习笔记 -- 多线程操作

M团店铺评价采集不到问题问题展示：解决方案：

Python爬虫学习（1）

Python爬虫学习进阶

Python爬虫（入门+进阶）学习笔记 1-2 初识Python爬虫

Python进阶爬虫——Class1：认识爬虫

python爬虫学习笔记-1

python学习之urllib使用小结

NOIp模拟题之肮脏的牧师（桶排序）

一篇文章教你如何在一个月内学会爬取大规模数据

Pyhton爬虫实战 - 抓取BOSS直聘职位描述和数据清洗Pyhton爬虫实战 - 抓取BOSS直聘职位描述和数据清洗

sort()函数到底是怎样进行数字排序的