正規表達式提取标簽,String提取标簽的text文本
- eclipse完整代碼
eclipse完整代碼
java:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
//h5資料
String data ="<div id=\"query-box\">\r\n" +
" <div class=\"box-name\">Query</div>\r\n" +
" <textarea id=\"query\"></textarea>\r\n" +
" </div>\r\n" +
" <div id=\"results-box\">\r\n" +
" <div class=\"box-name\">Results (<span id=\"node-count\">0</span>)</div>\r\n" +
" <textarea id=\"results\" readonly=\"readonly\"></textarea>\r\n" +
" </div>";
//正規表達式
Pattern patten= Pattern.compile("<div class=\"box-name\">(.*?)</div>");
Matcher m = patten.matcher(data);
//百度後發現必須find()過調用才能調用group(),不然會報錯。(望指正)
while (m.find()){
String str = m.group();
//indexOf()正向查找,并傳回第一個字元位置,lastIndexOf()反向查找,并傳回找到的第一個字元位置,substring()截取字元串
String str_sub = str.substring(str.indexOf(">")+1, str.lastIndexOf("<"));//截取字元串,拿到使用者名
System.out.println("截取字元串字元串:" + str_sub);
}
//下面展示的是對字元串的操作
String str = "<div class=\\\"box-name\\\">Query</div>";
System.out.println("字元串>位置:" + str.indexOf(">"));
System.out.println("字元串<位置:" + str.lastIndexOf("<"));
System.out.println("取标簽的text值:" + str.substring(str.indexOf(">")+1, str.lastIndexOf("<")));
}
}
輸出:
截取字元串字元串:Query
截取字元串字元串:Results (0)
字元串>位置:23
字元串<位置:29
取标簽的text值:Query