天天看點

php正則挑選某個字元串,PHP正規表達式比對字元串中的指定标簽

下面我們給出一個PHP正規表達式比對字元串中的指定标簽實作程式代碼,有需要學習的朋友可參考本教程。

在 PHP 應用中,正規表達式主要用于:

•正則比對:根據正規表達式比對相應的内容

•正則替換:根據正規表達式比對内容并替換

•正則分割:根據正規表達式分割字元串

常用

preg_match_all()

preg_match_all() 函數用于進行正規表達式全局比對,成功傳回整個模式比對的次數(可能為零),如果出錯傳回 FALSE 。

文法:

int preg_match_all( string pattern, string subject, array matches [, int flags ] )

執行個體

$str = "之二寬闊的甘家口東#标簽1#标簽2 #标簽3。#标簽4,都發$1234 ¥xc,cvm , ¥12,dflksjf如何#标簽5.x

 代碼如下 複制代碼

#tag6.cvxcv“";

preg_match_all('/#([a-zA-Z0-9x7f-xff] )/', $str, $mat);

print_r($mat);

preg_match("/[x{00a5}x{ffe5}](d )/u", $str, $mat);

print_r($mat);

正則比對中文漢字根據頁面編碼不同而略有差別:

•GBK/GB2312編碼:[x80-xff>] 或 [xa1-xff]

•UTF-8編碼:[x{4e00}-x{9fa5}] /u

例子:

 代碼如下 複制代碼

$str = "學習php是一件快樂的事。";

preg_match_all("/[x80-xff] /", $str, $match);

//UTF-8 使用:

//preg_match_all("/[x{4e00}-x{9fa5}] /u", $str, $match);

print_r($match);

?>

補充說明:

雙位元組字元編碼範圍

1. GBK (GB2312/GB18030)

x00-xff GBK雙位元組編碼範圍

x20-x7f ASCII

xa1-xff 中文 gb2312

x80-xff 中文 gbk

2. UTF-8 (Unicode)

u4e00-u9fa5 (中文)

x3130-x318F (韓文

xAC00-xD7A3 (韓文)

u0800-u4e00 (日文)