天天看點

正規表達式提取标簽,String提取text文本eclipse完整代碼

正規表達式提取标簽,String提取标簽的text文本

  • eclipse完整代碼

eclipse完整代碼

java:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Main {

	public static void main(String[] args) {
		//h5資料
		String data ="<div id=\"query-box\">\r\n" + 
				"      <div class=\"box-name\">Query</div>\r\n" + 
				"      <textarea id=\"query\"></textarea>\r\n" + 
				"    </div>\r\n" + 
				"    <div id=\"results-box\">\r\n" + 
				"      <div class=\"box-name\">Results (<span id=\"node-count\">0</span>)</div>\r\n" + 
				"      <textarea id=\"results\" readonly=\"readonly\"></textarea>\r\n" + 
				"    </div>";
		//正規表達式
		 Pattern patten= Pattern.compile("<div class=\"box-name\">(.*?)</div>");
		 Matcher m = patten.matcher(data);
		 //百度後發現必須find()過調用才能調用group(),不然會報錯。(望指正)
		 while (m.find()){
             String str = m.group();
             //indexOf()正向查找,并傳回第一個字元位置,lastIndexOf()反向查找,并傳回找到的第一個字元位置,substring()截取字元串
             String str_sub = str.substring(str.indexOf(">")+1, str.lastIndexOf("<"));//截取字元串,拿到使用者名
             System.out.println("截取字元串字元串:" + str_sub);
		 }
		 
		 //下面展示的是對字元串的操作
		 String str  = "<div class=\\\"box-name\\\">Query</div>";
		System.out.println("字元串>位置:" + str.indexOf(">"));
		System.out.println("字元串<位置:" + str.lastIndexOf("<"));
		System.out.println("取标簽的text值:" + str.substring(str.indexOf(">")+1, str.lastIndexOf("<")));
	}

}

           

輸出:

截取字元串字元串:Query

截取字元串字元串:Results (0)

字元串>位置:23

字元串<位置:29

取标簽的text值:Query