天天看點

Oracle中like效率正規表達式淺析

oracle 中like常用但是其效率不是高。

  特别是使用%a%-----》全局掃描,沒有利用到任何索引。

  情況可以的條件盡量下使用a%------》可以利用正序的索引。

                          %a------》可以利用反序的索引(當然得已有反序的索引)。

使用instr函數取代like查詢,可提高效率,在海量資料中效果尤其明顯。

1.%a%方式:

select * from pub_yh_bm t

where instr(t.chr_bmdm,'2')>0

等份于:

where t.chr_bmdm like '%2%'

2.%a方式:

where instr(t.chr_bmdm,'110101')=length(t.chr_bmdm)-length('110101')+1

where t.chr_bmdm like '%110101'

3.a%方式:

where instr(t.chr_bmdm,'11010101')=1

where t.chr_bmdm like '11010101%'

oracle中的支援正規表達式的函數主要有下面四個:

1,regexp_like :與like的功能相似

2,regexp_instr :與instr的功能相似

3,regexp_substr :與substr的功能相似

4,regexp_replace :與replace的功能相似

它們在用法上與oracle sql 函數like、instr、substr 和replace 用法相同,

但是它們使用posix 正規表達式代替了老的百分号(%)和通配符(_)字元。

posix 正規表達式由标準的元字元(metacharacters)所構成:

'^' 比對輸入字元串的開始位置,在方括号表達式中使用,此時它表示不接受該字元集合。

'$' 比對輸入字元串的結尾位置。如果設定了 regexp 對象的 multiline 屬性,則 $ 也匹

配 '\n' 或 '\r'。

'.' 比對除換行符之外的任何單字元。

'?' 比對前面的子表達式零次或一次。

'+' 比對前面的子表達式一次或多次。

'*' 比對前面的子表達式零次或多次。

'|' 指明兩項之間的一個選擇。例子'^([a-z]+|[0-9]+)$'表示所有小寫字母或數字組合成的

字元串。

'( )' 标記一個子表達式的開始和結束位置。

'[]' 标記一個中括号表達式。

'{m,n}' 一個精确地出現次數範圍,m=<出現次數<=n,'{m}'表示出現m次,'{m,}'表示至少

出現m次。

\num 比對 num,其中 num 是一個正整數。對所擷取的比對的引用。

字元簇:

[[:alpha:]] 任何字母。

[[:digit:]] 任何數字。

[[:alnum:]] 任何字母和數字。

[[:space:]] 任何白字元。

[[:upper:]] 任何大寫字母。

[[:lower:]] 任何小寫字母。

[[:punct:]] 任何标點符号。

[[:xdigit:]] 任何16進制的數字,相當于[0-9a-fa-f]。

各種操作符的運算優先級

\轉義符

(), (?:), (?=), [] 圓括号和方括号

*, +, ?, {n}, {n,}, {n,m} 限定符

^, $, anymetacharacter 位置和順序

範例:

--regexp_like

--查詢value中以1開頭60結束的記錄并且長度是7位

select * from fzq where value like '1____60';

select * from fzq where regexp_like(value,'1....60');

--查詢value中以1開頭60結束的記錄并且長度是7位并且全部是數字的記錄。

--使用like就不是很好實作了。

select * from fzq where regexp_like(value,'1[0-9]{4}60');

-- 也可以這樣實作,使用字元集。

select * from fzq where regexp_like(value,'1[[:digit:]]{4}60');

-- 查詢value中不是純數字的記錄

select * from fzq where not regexp_like(value,'^[[:digit:]]+$');

-- 查詢value中不包含任何數字的記錄。

select * from fzq where regexp_like(value,'^[^[:digit:]]+$');

--查詢以12或者1b開頭的記錄.不區分大小寫。

select * from fzq where regexp_like(value,'^1[2b]','i');

--查詢以12或者1b開頭的記錄.區分大小寫。

select * from fzq where regexp_like(value,'^1[2b]');

-- 查詢資料中包含空白的記錄。

select * from fzq where regexp_like(value,'[[:space:]]');

--查詢所有包含小寫字母或者數字的記錄。

select * from fzq where regexp_like(value,'^([a-z]+|[0-9]+)$');

--查詢任何包含标點符号的記錄。

select * from fzq where regexp_like(value,'[[:punct:]]');

select * from dba_tables b where regexp_like(b.table_name,'^[[a-z]]$') and b.owner='sscp2'