天天看點

php 字元串轉數組 提取中文 提取英文 字元串類型

擷取字元串類型

/**
 * 判斷中英文
 */
public function checkStr($str){
	$output = ''; ///\<[\s\S]*\>/i
	$a = preg_match('/[' . chr(0xa1) . '-' . chr(0xff) . ']/i', $str);
	$b = preg_match('/[0-9]/i', $str);
	$c = preg_match('/[a-zA-Z]/i', $str);
	if($a && $b && $c){
		$output = 1; //'漢字數字英文的混合字元串';
	}elseif($a && $b && !$c){
		$output = 2; //'漢字數字的混合字元串';
	}elseif($a && !$b && $c){
		$output = 3; //'漢字英文的混合字元串';
	}elseif(!$a && $b && $c){
		$output = 4; //'數字英文的混合字元串';
	}elseif($a && !$b && !$c){
		$output = 5; //'純漢字';
	}elseif(!$a && $b && !$c){
		$output = 6; //'純數字';
	}elseif(!$a && !$b && $c){
		$output = 7; //'純英文';
	}
	return $output;
}      

 提取中文

/**
 * 
 * 隻提取中文名稱
 * @param $srchKeyword
 */
public function getCN($srchKeyword){
	$preg_repOne = array("|[0-9a-zA-Z/-]+|", '/\(|\)/', '/\《|\》/', '/\+|\-|\*|\//' , '/\{|\}/', '/\<|\>/', '/\【|\】/', '/\[|\]/', '/\(|\)/'
	);
	$preg_repTwo = array(' ',
	PHP_EOL,'+',
    '-', '\'', '/', '\\', '[', ']', '{', '}', 'è', 'β', '±', '^', '’', '~', '-', '+', '.', '。', '\'', '#', '@', '!', '&', '*', '<', '>', '%', 'α', 'γ', 'ε', '', '<i>', '</i>' , '[', ']', '-', 'δ', '+', '【', '】', '#', ';', '\\r', '\′', '′', ',', '_');
	$str = preg_replace($preg_repOne, array('', ''), $srchKeyword);
	$str = str_replace($preg_repTwo, array('', ''), $str);
	$str = mb_substr($str,0,255,'utf-8');
	return trim($str);
}      

提取英文

/**
 * 提取英文
 * @param $srchKeyword
 */
public function getEN($srchKeyword){
	$preg_repOne = array('/[-][a-zA-Z][0-9]/i', '/[0-9]/i', '/[a-zA-Z][0-9][-]/i', '/[^\[0-9]da-zA-Z]/i', '/\(|\)/', '/\《|\》/', '/\+|\-|\*|\//' , '/\{|\}/', '/\<|\>/', '/\【|\】/', '/\[|\]/', '/\(|\)/'
	);
	$preg_repTwo = array(' ',
	PHP_EOL,
    '-', '\'', '/', '\\', '[', ']', '{', '}', 'è', 'β', '±', '^', '’', '~', '-', '+', '.', '。', '\'', '#', '@', '!', '&', '*', '<', '>', '%', 'α', 'γ', 'ε', '', '<i>', '</i>' , '[', ']', '-', 'δ', '+', '【', '】', '#', ';', '\\r', '\′', '′', '(', ')', '(', ')', ',', '_');
	$str = preg_replace($preg_repOne, array('', ''), $srchKeyword);
	$str = str_replace($preg_repTwo, array('', ''), $str);
	$str = mb_substr($str, 0, 255, 'utf-8');
	return strtolower($str);
}      

字元串轉數組

/**
* 字元串轉數組
* @param $key_words 傳入的字元串
* @param $type 字元串類型
*/
function get_key_arr($key_words,$type = 'en'){
$ex_ = 1;
$str_len = strlen($key_words);
$return_arr = '';
if($type == 'cn'){
	$ex_ = 3;//漢字占3個長度
	$str_num = ceil($str_len/$ex_);
	for ($i = 1; $i <= $str_num; $i++) {
		$start = ($i-1)*$ex_;
		$return_arr [] = substr($key_words,$start,$ex_);
	}
}else{
	for ($i = 0; $i < $str_len; $i++) {
		$return_arr [] = $key_words[$i];
	}
}
$return_arr = array_unique($return_arr);
return $return_arr;
}      
/**
 * 高亮顯示函數
 * @param  $message 需要高亮字的符串
 * @param  $str	    需要高亮的部分字元串
 * @param  $color   高亮顯示顔色
 */
function bat_highlight($message,$str,$color = '#ff0000'){

$checkstr = $this->checkStr($str);
if($checkstr== 7 || $checkstr == 4){
	$words_info_en = $this->getEN($str);
	$return_arr = $this->get_key_arr($words_info_en);
}elseif($checkstr== 1 || $checkstr == 2 || $checkstr == 3 || $checkstr == 5){
	$words_info_cn = $this->getCN($str);
	$return_arr = $this->get_key_arr($words_info_cn,'cn');
}
foreach ($return_arr as $value) {
	$message = preg_replace("/($value)/i", '@#\1#@',$message);
}
/**
* 把辨別替換回來
* @# == <span style="color:#ff0000">
* #@ == </span>
*/
$message = str_replace('@#', '<span style="color:'.$color.'">', $message);
$message = str_replace('#@', '</span>', $message);
return $message;
}