正则表达式提取标签,String提取标签的text文本
- eclipse完整代码
eclipse完整代码
java:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
//h5数据
String data ="<div id=\"query-box\">\r\n" +
" <div class=\"box-name\">Query</div>\r\n" +
" <textarea id=\"query\"></textarea>\r\n" +
" </div>\r\n" +
" <div id=\"results-box\">\r\n" +
" <div class=\"box-name\">Results (<span id=\"node-count\">0</span>)</div>\r\n" +
" <textarea id=\"results\" readonly=\"readonly\"></textarea>\r\n" +
" </div>";
//正则表达式
Pattern patten= Pattern.compile("<div class=\"box-name\">(.*?)</div>");
Matcher m = patten.matcher(data);
//百度后发现必须find()过调用才能调用group(),不然会报错。(望指正)
while (m.find()){
String str = m.group();
//indexOf()正向查找,并返回第一个字符位置,lastIndexOf()反向查找,并返回找到的第一个字符位置,substring()截取字符串
String str_sub = str.substring(str.indexOf(">")+1, str.lastIndexOf("<"));//截取字符串,拿到用户名
System.out.println("截取字符串字符串:" + str_sub);
}
//下面展示的是对字符串的操作
String str = "<div class=\\\"box-name\\\">Query</div>";
System.out.println("字符串>位置:" + str.indexOf(">"));
System.out.println("字符串<位置:" + str.lastIndexOf("<"));
System.out.println("取标签的text值:" + str.substring(str.indexOf(">")+1, str.lastIndexOf("<")));
}
}
输出:
截取字符串字符串:Query
截取字符串字符串:Results (0)
字符串>位置:23
字符串<位置:29
取标签的text值:Query