1. 界定符 兩邊加上“/……/” 同時也可以使用“#……#”
2. 原子 可見原子&不可見原子 最小的機關
可見原子:能夠用肉眼看見的字元
不可見原子:肉眼看不見的原子,如:\n 換行符 \t 制表符
建議:在關于漢字進行比對的時候,先去站長工具,把漢字轉化成Unicode編碼,在進行比對,可以避免編碼不同産生的錯誤。
3. 元字元
原子的篩選方式
| 比對兩個或多個分支選擇。
[.......] 比對方括号中的任意一個原子
[^.......] 比對除方括号中的原子之外的任意一個字元,注:[^ 這兩個符号必須連在一起。
原子的集合
. 比對除了換行符之外的任意字元。等價于 [^\n]
\d 比對一個十進制的數字 [0-9]
\D 比對一個非十進制數字 [^0-9]
\s 比對一個不可見的原子 [\t\n\r\f\v]
\S 比對任何一個可見原子 [^\t\n\r\f\v]
\w 比對任何一個數字、字母、下劃線 [0-9a-zA-Z_]
\W 比對任何一個非數字、字母、下劃線 [^0-9a-zA-Z_]
4. 量詞 不但支援原子,還支援原子的集合
{n} 其前面的原子正好出現n次
{n,} 其前面的原子最少出現n次
{n,m} 其前面的原子最少出現n次,最多出現m次
* 比對0次,1次,多次 {0,}
+ 比對1次,多次 {1,}
? 比對0次,1次 {0,1}
5. 邊界控制
^ 必須以其後的那一個原子開始
$ 必須以之前的那一個原子結束
() 比對其中的整體為一個原子