天天看点

正则表达式提取标签,String提取text文本eclipse完整代码

正则表达式提取标签,String提取标签的text文本

  • eclipse完整代码

eclipse完整代码

java:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Main {

	public static void main(String[] args) {
		//h5数据
		String data ="<div id=\"query-box\">\r\n" + 
				"      <div class=\"box-name\">Query</div>\r\n" + 
				"      <textarea id=\"query\"></textarea>\r\n" + 
				"    </div>\r\n" + 
				"    <div id=\"results-box\">\r\n" + 
				"      <div class=\"box-name\">Results (<span id=\"node-count\">0</span>)</div>\r\n" + 
				"      <textarea id=\"results\" readonly=\"readonly\"></textarea>\r\n" + 
				"    </div>";
		//正则表达式
		 Pattern patten= Pattern.compile("<div class=\"box-name\">(.*?)</div>");
		 Matcher m = patten.matcher(data);
		 //百度后发现必须find()过调用才能调用group(),不然会报错。(望指正)
		 while (m.find()){
             String str = m.group();
             //indexOf()正向查找,并返回第一个字符位置,lastIndexOf()反向查找,并返回找到的第一个字符位置,substring()截取字符串
             String str_sub = str.substring(str.indexOf(">")+1, str.lastIndexOf("<"));//截取字符串,拿到用户名
             System.out.println("截取字符串字符串:" + str_sub);
		 }
		 
		 //下面展示的是对字符串的操作
		 String str  = "<div class=\\\"box-name\\\">Query</div>";
		System.out.println("字符串>位置:" + str.indexOf(">"));
		System.out.println("字符串<位置:" + str.lastIndexOf("<"));
		System.out.println("取标签的text值:" + str.substring(str.indexOf(">")+1, str.lastIndexOf("<")));
	}

}

           

输出:

截取字符串字符串:Query

截取字符串字符串:Results (0)

字符串>位置:23

字符串<位置:29

取标签的text值:Query