思路如下：

（1）分析各页间的网址规律，通过for循环实现多页内容的爬取

（2）构建一个函数，用来获取用户和内容

注意：

程序中用到了exec()函数，exec()函数就是执行储存在字符串或文件中的Python语句。在通过for循环中遍历段子内容分别赋值给对应遍历，变量名是有规律的，格式为：content+顺序号

程序

import urllib.request
import re
def getcontent(url,page):
    headers = ("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36")
    opener = urllib.request.build_opener()
    opener.addheaders = [headers]
    urllib.request.install_opener(opener)
    data = urllib.request.urlopen(url).read().decode("utf-8")
    # .*? 是一个固定的搭配，.和*代表可以匹配任意无限多个字符，加上？表示使用非贪婪模式进行匹配
    # (.*?)代表一个分组
    userpat = '<div class="author clearfix">.*?<img src=".*?" alt="(.*?)">'
    # userpat = '<div class="author clearfix">.*?<h2>(.*?)</h2>'
    contentpat = '<div class="content">.*?<span>(.*?)</span>'
    # re.S匹配任意符号，包括换行符
    userlist = re.compile(userpat,re.S).findall(data)
    contentlist = re.compile(contentpat,re.S).findall(data)
    x = 1
    # 通过for循环遍及内容分别赋给对应的变量
    for content in contentlist:
        content = content.replace("\n","")
        name = "content"+str(x)
        # 通过exec()函数实现用字符串作为变量名并赋值
        exec(name+'=content')
        x += 1
        # 下面调试两个输出结果显示的结果是一样的
        # print(content)
        # exec("print("+name+")")

    y = 1
    for user in userlist:
        name = "content" + str(y)
        print("用户"+str(page)+str(y)+"是："+user)
        print("内容是：")
        exec("print("+name+")")
        print("\n")
        y += 1

for i in range(1,4):
    url = "https://www.qiushibaike.com/text/page/"+str(i)
    getcontent(url,i)

输出结果显示：

Python基础学习之糗事百科爬虫思路如下：程序

以上是还存在不足，后期再更改。

Python基础学习之糗事百科爬虫思路如下：程序

思路如下：

程序

继续阅读

yield和return的区别

python 创建线程

python字符串基础，超级详细，超全面

为什么Python是机器学习的最佳选择？带你揭秘Python关于Python技术储备

我，阿里的程序员，工作5年，揭秘阿里员工的真实收入和工作经历关于Python技术储备

Python3.6 基础知识

Python基础--元组&字典&集合

阿里云天池Python训练营（第1天）Python入门(上)变量、运算符与数据类型位运算循环语句异常处理

day17面向对象面向对象

Python基础学习06——元组&字典&集合1. 元组简介2. 字典简介3. 遍历字典4. 集合

python基础（三）元组@字典1.元组2.字典3.可变对象

Python基础-08 元组和字典一、元组1.3 访问元组中的元素二、可变对象三、 ==和is的区别四、字典五、浅复制copy()六、遍历字典

Python基础（三）——列表，元组，字典一.列表二.元组三.字典

《笨方法学 Python 3》29. if语句

聚类算法--无监督学习

python的函数抽象复用--以定时器为例简单的内循环方法函数化functooldecoratordecorator的局限性coroutine