爬取图片 #html #chrome #链接地址 #safari #图吧

爬取图片

2021-08-06 00:18:00

爬取小姐姐的美图

一、缘由

　　我想每一个学习爬虫的都会爬取一次小姐姐的美图吧，我也不例外。还记得这是我刚学不久的时候爬取的图片。来，先上效果图。

二、代码实现

#encoding='utf-8'

#1、拿到主页面的源代码，然后提取到企业民的链接地址，herf
#2、通过herf拿到子页面的内容，从子页面中找到图片的下载地址  img->src
#3、下载图片




import  requests
from bs4 import BeautifulSoup
import  time

def main():
    url=f'''https://www.umei.net/meinvtupian/index_3.htm'''
    res=askURL(url)             #第一次进行请求，获得网页的源代码
    getData(res)
    print('all over!')


def getData(res):  #解析第一次请求得到的页面
    html=BeautifulSoup(res,'html.parser')
    li=html.find('div',class_='TypeList').find_all('img')
    for i in li:
        img=i.get('src')
        p=requests.get(img)
        jpg=p.content
        nam=img.split('/')[-1]
        with open(r'C:\Users\sunshine\Desktop\图片\i'+nam,"ab+") as f:
            f.write(jpg)
        print(nam,'over')
        time.sleep(1)



def askURL(url):
    headers={
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"

    }
    res=requests.get(url,headers=headers)
    res.encoding='UTF-8'
    return  res.text


if __name__ == '__main__':
    main()

爬取图片

二、代码实现

继续阅读

web前端布局练手项目

Django之验证码（十七）验证码

Vue项目 - 单文件组件和Vue中的路由

龙珠训练营task04

赶工心得（一）

一个小小的移动web版音乐播放器

Docker - Dockerfile之ADD、COPY、WORKDIR、USER、EXPOSE指令详解

selenium 自动抢课——电子科大自动抢课脚本前言：使用方法：`代码：

Compile workrave under windows &ndash; My exprience 在Windows上编译Workrave

门户通专访草根站长九天狼：做站贵在坚持

tabpanel 使用问题

为什么把CSS放头部，script放下面

linux下的完美网银们（google chrome, ubuntu10.04）

CSS之折叠菜单

web开发之前后端渲染

403 Forbidden，You don't have permission to access / on this server.Forbidden