Java正規表達式的文法與示例

轉載位址：https://www.cnblogs.com/lzq198754/p/5780340.html

java 正規表達式文法示例概要：

Java正規表達式的文法與示例

| |目錄

1比對驗證-驗證Email是否正确
2在字元串中查詢字元或者字元串
3常用正規表達式
4正規表達式文法

1比對驗證-驗證Email是否正确

Java | 複制

1 2 3 4 5 6 7 8 9 10 11 12 13 14

public

static

void

main(String[] args) {

// 要驗證的字元串

String str =

"[email protected]"

// 郵箱驗證規則

String regEx =

"[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\\.){1,3}[a-zA-z\\-]{1,}"

// 編譯正規表達式

Pattern pattern = Pattern.compile(regEx);

// 忽略大小寫的寫法

// Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);

Matcher matcher = pattern.matcher(str);

// 字元串是否與正規表達式相比對

boolean

rs = matcher.matches();

System.out.println(rs);

2在字元串中查詢字元或者字元串

Java | 複制

1 2 3 4 5 6 7 8 9 10 11 12 13 14

public

static

void

main(String[] args) {

// 要驗證的字元串

String str =

"baike.xsoftlab.net"

// 正規表達式規則

String regEx =

"baike.*"

// 編譯正規表達式

Pattern pattern = Pattern.compile(regEx);

// 忽略大小寫的寫法

// Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);

Matcher matcher = pattern.matcher(str);

// 查找字元串中是否有比對正規表達式的字元/字元串

boolean

rs = matcher.find();

System.out.println(rs);

3常用正規表達式

規則	正規表達式文法
一個或多個漢字	^[\u0391-\uFFE5]+$
郵政編碼	^[1-9]\d{5}$
QQ号碼	^[1-9]\d{4,10}$
郵箱	^[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\.){1,3}[a-zA-z\-]{1,}$
使用者名（字母開頭 + 數字/字母/下劃線）	^[A-Za-z][A-Za-z1-9_-]+$
手機号碼	^1[3\|4\|5\|8][0-9]\d{8}$
URL	^((http\|https)://)?([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
18位身份證号	^(\d{6})(18\|19\|20)?(\d{2})([01]\d)([0123]\d)(\d{3})(\d\|X\|x)?$

4正規表達式文法

元字元	描述
\	将下一個字元标記符、或一個向後引用、或一個八進制轉義符。例如，“\\n”比對\n。“\n”比對換行符。序列“\\”比對“\”而“\(”則比對“(”。即相當于多種程式設計語言中都有的“轉義字元”的概念。
^	比對輸入字元串的開始位置。如果設定了RegExp對象的Multiline屬性，^也比對“\n”或“\r”之後的位置。
$	比對輸入字元串的結束位置。如果設定了RegExp對象的Multiline屬性，$也比對“\n”或“\r”之前的位置。
*	比對前面的子表達式任意次。例如，zo能比對“z”，“zo”以及“zoo”。等價于{0,}。
+	比對前面的子表達式一次或多次(大于等于1次）。例如，“zo+”能比對“zo”以及“zoo”，但不能比對“z”。+等價于{1,}。
?	比對前面的子表達式零次或一次。例如，“do(es)?”可以比對“do”或“does”中的“do”。?等價于{0,1}。
{n}	n是一個非負整數。比對确定的n次。例如，“o{2}”不能比對“Bob”中的“o”，但是能比對“food”中的兩個o。
{n,}	n是一個非負整數。至少比對n次。例如，“o{2,}”不能比對“Bob”中的“o”，但能比對“foooood”中的所有o。“o{1,}”等價于“o+”。“o{0,}”則等價于“o*”。
{n,m}	m和n均為非負整數，其中n<=m。最少比對n次且最多比對m次。例如，“o{1,3}”将比對“fooooood”中的前三個o。“o{0,1}”等價于“o?”。請注意在逗号和兩個數之間不能有空格。
?	當該字元緊跟在任何一個其他限制符（*,+,?，{n}，{n,}，{n,m}）後面時，比對模式是非貪婪的。非貪婪模式盡可能少的比對所搜尋的字元串，而預設的貪婪模式則盡可能多的比對所搜尋的字元串。例如，對于字元串“oooo”，“o+?”将比對單個“o”，而“o+”将比對所有“o”。
.點	比對除“\r\n”之外的任何單個字元。要比對包括“\r\n”在内的任何字元，請使用像“[\s\S]”的模式。
(pattern)	比對pattern并擷取這一比對。所擷取的比對可以從産生的Matches集合得到，在VBScript中使用SubMatches集合，在JScript中則使用$0…$9屬性。要比對圓括号字元，請使用“$”或“$”。
(?:pattern)	比對pattern但不擷取比對結果，也就是說這是一個非擷取比對，不進行存儲供以後使用。這在使用或字元“(\|)”來組合一個模式的各個部分是很有用。例如“industr(?:y\|ies)”就是一個比“industry\|industries”更簡略的表達式。
(?=pattern)	正向肯定預查，在任何比對pattern的字元串開始處比對查找字元串。這是一個非擷取比對，也就是說，該比對不需要擷取供以後使用。例如，“Windows(?=95\|98\|NT\|2000)”能比對“Windows2000”中的“Windows”，但不能比對“Windows3.1”中的“Windows”。預查不消耗字元，也就是說，在一個比對發生後，在最後一次比對之後立即開始下一次比對的搜尋，而不是從包含預查的字元之後開始。
(?!pattern)	正向否定預查，在任何不比對pattern的字元串開始處比對查找字元串。這是一個非擷取比對，也就是說，該比對不需要擷取供以後使用。例如“Windows(?!95\|98\|NT\|2000)”能比對“Windows3.1”中的“Windows”，但不能比對“Windows2000”中的“Windows”。
(?<=pattern)	反向肯定預查，與正向肯定預查類似，隻是方向相反。例如，“(?<=95\|98\|NT\|2000)Windows”能比對“2000Windows”中的“Windows”，但不能比對“3.1Windows”中的“Windows”。
(?<!pattern)	反向否定預查，與正向否定預查類似，隻是方向相反。例如“(?<!95\|98\|NT\|2000)Windows”能比對“3.1Windows”中的“Windows”，但不能比對“2000Windows”中的“Windows”。
x\|y	比對x或y。例如，“z\|food”能比對“z”或“food”或"zood"(此處請謹慎)。“(z\|f)ood”則比對“zood”或“food”。
[xyz]	字元集合。比對所包含的任意一個字元。例如，“[abc]”可以比對“plain”中的“a”。
[^xyz]	負值字元集合。比對未包含的任意字元。例如，“[^abc]”可以比對“plain”中的“plin”。
[a-z]	字元範圍。比對指定範圍内的任意字元。例如，“[a-z]”可以比對“a”到“z”範圍内的任意小寫字母字元。注意:隻有連字元在字元組内部時,并且出現在兩個字元之間時,才能表示字元的範圍; 如果出字元組的開頭,則隻能表示連字元本身.
[^a-z]	負值字元範圍。比對任何不在指定範圍内的任意字元。例如，“[^a-z]”可以比對任何不在“a”到“z”範圍内的任意字元。
\b	比對一個單詞邊界，也就是指單詞和空格間的位置（即正規表達式的“比對”有兩種概念，一種是比對字元，一種是比對位置，這裡的\b就是比對位置的）。例如，“er\b”可以比對“never”中的“er”，但不能比對“verb”中的“er”。
\B	比對非單詞邊界。“er\B”能比對“verb”中的“er”，但不能比對“never”中的“er”。
\cx	比對由x指明的控制字元。例如，\cM比對一個Control-M或回車符。x的值必須為A-Z或a-z之一。否則，将c視為一個原義的“c”字元。
\d	比對一個數字字元。等價于[0-9]。
\D	比對一個非數字字元。等價于[^0-9]。
\f	比對一個換頁符。等價于\x0c和\cL。
\n	比對一個換行符。等價于\x0a和\cJ。
\r	比對一個回車符。等價于\x0d和\cM。
\s	比對任何不可見字元，包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。
\S	比對任何可見字元。等價于[^ \f\n\r\t\v]。
\t	比對一個制表符。等價于\x09和\cI。
\v	比對一個垂直制表符。等價于\x0b和\cK。
\w	比對包括下劃線的任何單詞字元。類似但不等價于“[A-Za-z0-9_]”，這裡的"單詞"字元使用Unicode字元集。
\W	比對任何非單詞字元。等價于“[^A-Za-z0-9_]”。
\xn	比對n，其中n為十六進制轉義值。十六進制轉義值必須為确定的兩個數字長。例如，“\x41”比對“A”。“\x041”則等價于“\x04&1”。正規表達式中可以使用ASCII編碼。
\num	比對num，其中num是一個正整數。對所擷取的比對的引用。例如，“(.)\1”比對兩個連續的相同字元。
\n	辨別一個八進制轉義值或一個向後引用。如果\n之前至少n個擷取的子表達式，則n為向後引用。否則，如果n為八進制數字（0-7），則n為一個八進制轉義值。
\nm	辨別一個八進制轉義值或一個向後引用。如果\nm之前至少有nm個獲得子表達式，則nm為向後引用。如果\nm之前至少有n個擷取，則n為一個後跟文字m的向後引用。如果前面的條件都不滿足，若n和m均為八進制數字（0-7），則\nm将比對八進制轉義值nm。
\nml	如果n為八進制數字（0-7），且m和l均為八進制數字（0-7），則比對八進制轉義值nml。
\un	比對n，其中n是一個用四個十六進制數字表示的Unicode字元。例如，\u00A9比對版權符号（©）。
\< \>	比對詞（word）的開始（\<）和結束（\>）。例如正規表達式\<the\>能夠比對字元串"for the wise"中的"the"，但是不能比對字元串"otherwise"中的"the"。注意：這個元字元不是所有的軟體都支援的。
	将 $ 和 $ 之間的表達式定義為“組”（group），并且将比對這個表達式的字元儲存到一個臨時區域（一個正規表達式中最多可以儲存9個），它們可以用 \1 到\9 的符号來引用。
\|	将兩個比對條件進行邏輯“或”（Or）運算。例如正規表達式(him\|her) 比對"it belongs to him"和"it belongs to her"，但是不能比對"it belongs to them."。注意：這個元字元不是所有的軟體都支援的。
+	比對1或多個正好在它之前的那個字元。例如正規表達式9+比對9、99、999等。注意：這個元字元不是所有的軟體都支援的。
?	比對0或1個正好在它之前的那個字元。注意：這個元字元不是所有的軟體都支援的。
{i} {i,j}	比對指定數目的字元，這些字元是在它之前的表達式定義的。例如正規表達式A[0-9]{3} 能夠比對字元"A"後面跟着正好3個數字字元的串，例如A123、A348等，但是不比對A1234。而正規表達式[0-9]{4,6} 比對連續的任意4個、5個或者6個數字

Java正規表達式的文法與示例

| |目錄

1比對驗證-驗證Email是否正确

2在字元串中查詢字元或者字元串

3常用正規表達式

4正規表達式文法

繼續閱讀

關于Gradle配置的小結

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method