Python基础 - 10正则与re

2021-10-23 08:48:00

Python基础 - 10正则与re

正则表达式是对字符串操作的一种逻辑公式，用事先定义好的一些特定字符、及特定字符的组合，组成一个"规则字符串"。

Regular Expression 普通字符（如a到z之间的字母）特殊字符（元字符）

\A：表示从字符串的开始处匹配。

\Z：表示从字符串的结束处匹配，如果存在换行，只匹配换行前的结束字符串。

\b：匹配一个单词边界，也就是单词和空格间的位置。如 'py\b' 可以匹配 "python" 的py，不能匹配 "openpyxl"的py。

\B：匹配非单词边界。 'py\b' 可以匹配 "openpyxl"的py，不能匹配 "python" 的py。

\d：匹配任意数字。等价于 [0-9]。

\D：匹配任意非数字字符。等价于 [^\d]。

\s：匹配任意空白字符。等价于 [\t\n\r\f]。

\S：匹配任意非空白字符。等价于 [^\s]。

\w：匹配任意字母数字及下划线，等价于 [0-9a-zA-Z_]。

\W：匹配任意非字母数字及下划线，等价于 [^\w]。

\\：匹配原义的反斜杠\。

量词：

re*：匹配 0个或多个表达式

re+：匹配 1个或多个表达式

re?：匹配 0个或 1个前面的正则表达式。

re{m}：匹配 m个前面的正则表达式。

re{m,}：匹配 m个或多个前面的正则表达式。

re{m,n}：匹配 m到n个前面的正则表达式。

非贪婪模式: *? +? ?? {m,n}?

^：匹配字符串的开头。

$：匹配字符串的结尾。

.：匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。

[...]：用来表示一组字符, 单独列出。如[amk] 匹配 'a'，'m'或'k'

(re)：匹配括号内的表达式，也表示一个组

a|b：匹配a 或 b

findall 匹配整个字符串，找到一个继续向下找，直到字符串结尾

Python中数量词默认是贪婪的，总是尝试匹配尽可能多的字符。非贪婪尝试匹配尽可能少的字符。

在 "*","?","+","{m,n}"后面加上?，使贪婪变成非贪婪。

Python基础 - 10正则与re

继续阅读

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

Cloud Studio初体验

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method

在python中创建excel并写入