BeautifulSoup库用法总结

2018-06-01 23:50:00

0.写在前面

在python的爬虫中，经常需要用到强大的beautifulsoup库，如之前写的

股票数据的爬取

中就用到了它。在这里，将详细总结beautifulsoup的用法，来巩固相关知识。以下便是我从各种网站搜集的资料，在这里做一个汇总。(我从不生产知识，我只是知识的搬运工）

1.基本介绍

beautifulsoup

2.安装/引用

安装：win平台中‘以管理员身份运行’cmd，执行

pip install beautifulsoup4

即可安装

引用：

from bs4 import BeautifulSoup

或

import bs4

即可

3.使用方法

先煲制一锅汤

解析器

基本元素

对应各元素

一个用于接下来分析的demo

tag标签

tag.name

attrs

string

comment

如果不想输出内容的注释，可以写一个if语句：
if type(newsoup.b.string)==element.Comment:
    print (newsoup.b.string)

bs4库将任何HTML输入都变成utf-8编码,python3.x默认支持编码是utf-8编码，解析无障碍

beautifulsoup库基本入门

HTML基本格式

标签树的下行遍历

标签树的上行遍历

标签树的平行遍历

本文参考

中国大学MOOC

kikaylee的专栏

BeautifulSoup库用法总结

0.写在前面

1.基本介绍

2.安装/引用

3.使用方法

继续阅读

Postman 还能做自动化接口测试？早学会早下班……

小程序的新战事

阿里云acp认证报名方法阿里云acp认证考试相关答疑

“云钉一体”背后，阿里云希望改变什么？

你的Idea还可用吗？不妨试试另一个开发神器！一、STS安装二、STS使用三、优化STS

【ECS常见问题】连接实例问题连接实例问题

用 Rust 重写 Linux 内核，这可能吗？挺进 Linux 世界，Rust 机会在哪？Linux 之父：驱动程序可能率先 Rust 化写在最后：

Kafka 连接器使用与开发

IE new Date()无效

跨域问题总结

荷小鱼 x mPaaS | 借助 H5 容器改善 App 白屏、浏览器兼容问题

AI驱动的Web App开发实战

beautifulsoup_如何使用 Python 和 BeautifulSoup 爬取网站 First Scraping 到中。

mPaaS 月度小报 | 3月发生的大事件

Android WebView 致安卓应用闪退，mPaaS 助你规避这波 Bug

解读 WebRTC 音频 NetEQ 及优化实践为什么要 “白话” NetEQ?丢包、抖动和优化的理解NetEQ 及相关模块NetEQ 内部模块NetEQ 相关模块优化点总结