天天看點

asp.net 擷取HTML meta标記中的内容

asp.net 擷取HTML meta标記中的内容

public   static   string  GetSingleTagValueByAttr( string  inputstring,  string  tagName,  string  attrname,  string  key)

asp.net 擷取HTML meta标記中的内容
asp.net 擷取HTML meta标記中的内容

         ... {

asp.net 擷取HTML meta标記中的内容

            Regex reg = new Regex("<" + tagName + " [^<>]*>", RegexOptions.IgnoreCase);

asp.net 擷取HTML meta标記中的内容

            MatchCollection matchs = reg.Matches(inputstring);

asp.net 擷取HTML meta标記中的内容

            string result = string.Empty;

asp.net 擷取HTML meta标記中的内容

            foreach (Match match in matchs)

asp.net 擷取HTML meta标記中的内容
asp.net 擷取HTML meta标記中的内容

            ...{

asp.net 擷取HTML meta标記中的内容

                string matchValue = match.Value;

asp.net 擷取HTML meta标記中的内容

                Regex regValue = new Regex("content=".*"", RegexOptions.IgnoreCase);

asp.net 擷取HTML meta标記中的内容

                if (matchValue.ToLower().IndexOf(attrname.ToLower() + "="" + key.ToLower() + """) != -1)

asp.net 擷取HTML meta标記中的内容
asp.net 擷取HTML meta标記中的内容

                ...{

asp.net 擷取HTML meta标記中的内容

                    if (regValue.IsMatch(matchValue))

asp.net 擷取HTML meta标記中的内容
asp.net 擷取HTML meta标記中的内容

                    ...{

asp.net 擷取HTML meta标記中的内容

                        result = regValue.Match(matchValue).Value;

asp.net 擷取HTML meta标記中的内容

                        if (!string.IsNullOrEmpty(result))

asp.net 擷取HTML meta标記中的内容
asp.net 擷取HTML meta标記中的内容

                        ...{

asp.net 擷取HTML meta标記中的内容

                            result = result.Replace("CONTENT=", "").Replace("content=","").Replace(""", "");

asp.net 擷取HTML meta标記中的内容

                        }

asp.net 擷取HTML meta标記中的内容

                    }

asp.net 擷取HTML meta标記中的内容

                    return result;

asp.net 擷取HTML meta标記中的内容

                }

asp.net 擷取HTML meta标記中的内容

            }

asp.net 擷取HTML meta标記中的内容

            return null;

asp.net 擷取HTML meta标記中的内容

        }

使用舉例:

擷取關鍵詞 GetSingleTagValueByAttr(data, "meta", "name", "Keywords");   data是HTML源代碼

擷取描述GetSingleTagValueByAttr(data, "meta", "name", "Discription");