天天看點

爬蟲資料提取——正規表達式

一、什麼是正規表達式?

正規表達式(regular expression)描述了一種字元串比對的模式(pattern),可以用來檢查一個串是否含有某種子串、将比對的子串替換或者從某個串中取出符合某個條件的子串等。

二、正規表達式學習方式

【由簡單到複雜,由文法到應用】

1.比對單個字元

2.比對多個字元

3.正規表達式應用執行個體

4.正規表達式應用于html字元串