正則表達(dá)式-站長(zhǎng)資訊網(wǎng)

我們要解析一個(gè)HTML文檔時(shí)可利用正則表達(dá)式取得標(biāo)簽內(nèi)容
例子：
以從字符串中取出所有A標(biāo)簽的 id號(hào)和內(nèi)容為例：
<a id=”1″ target=”_blank”>aaaaaaaaaa</a>
正則表達(dá)式：
<a[^<]*id[^<]*=[^<]*”(?<ID>[^<]*)”[^<]*target[^<]*=[^<]*”[^<]*_blank[^<]*” [^<]*>(?<content>[^<]*)</a>
正則分解：
[^<]*　是一個(gè)很有用的組合,能定位到下一個(gè)查詢關(guān)鍵字
(?<ID>[^<]*)  用于取得一個(gè)或者多個(gè)值直到遇到下一個(gè)關(guān)鍵字
<ID>　類似一個(gè)正則的變量，給用()號(hào)取得的內(nèi)容進(jìn)行標(biāo)識(shí)，以便于程序的調(diào)用
C#調(diào)用的例子：
string strRegex=@”<a[^<]*id[^<]*=[^<]*”(?<ID>[^<]*)”[^<]*target[^<]*=[^<]*”[^<]*_blank[^<]*” [^<]*>(?<CONTENT>[^<]*)</a>”;
string strSource=”<a id=”1″ target=”_blank”>aaaaaaaaaa</a>”
System.Text.RegularExpressions.Regex r;
                System.Text.RegularExpressions.MatchCollection m;
                mc= new System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
               ro = mc.Matches(strSource);
if (ro.Count >= 0)
{
   for (int i = 0; i < m.Count; i++)
    {
        //取出ID和內(nèi)容
         string id = ro[i].Groups[“ID”].Value;
         string topic = ro[i].Groups[“CONTENT”].Value;
    }
}

一	二	三	四	五	六	日
« 6月
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

亚洲最大看欧美片,亚洲图揄拍自拍另类图片,欧美精品v国产精品v呦,日本在线精品视频免费

正則表達(dá)式

相關(guān)推薦

熱門標(biāo)簽

近期文章