日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www

注冊|登錄

聯系電話:024-31891684  13390130939
沈陽軟件公司--沈陽軟件定制

沈陽軟件開發_沈陽軟件公司_沈陽軟件定制/軟件/最新技術

Latest technology最新技術

正文提取中用到的正則表達式

瀏覽量:2887

#region 相關正則表達式

 
/// <summary>
/// 去掉所有html標簽
/// </summary>
private static readonly Regex FilterAll = new Regex(
@"(\[([^=]*)(=[^\]]*)?\][\s\S]*?\[/\1\])|(?<lj>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");])<a\s+[^>]*>[^<]{2,}</a>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");]))|(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)|(\&\#\d+\;)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase); //(?<Link><a[\s\S]*?</a>)|
//(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)
 
/// <summary>
/// 找出title標簽
/// </summary>
private static readonly Regex FindTitle = new Regex(
@"<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出title標簽內容
/// </summary>
private static readonly Regex FindTitleContent = new Regex(
@"<\s*/?title\s*>(?<Content>[\s\S]*?)<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出h 和Strong標簽
/// </summary>
private static readonly Regex FindHStrong = new Regex(
@"<\s*/?h\s*>|<\s*/?strong\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出p 和br標簽
/// </summary>
private static readonly Regex FindPB = new Regex(
@"<\s*/?p\s*>|<\s*br\s*/?>|<\s*/?tr\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出nbsp標簽
/// </summary>
private static readonly Regex FindNbsp = new Regex(
@"&nbsp",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出結尾標簽
/// </summary>
private static readonly Regex FindS = new Regex(
@"(?<Content>[\s\S]*?)\$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為標準句
/// </summary>
private static readonly Regex IsSen = new Regex(
@"[,.,。!!;;::……??《》“”""]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句[strong][h]標簽過多的
/// </summary>
private static readonly Regex IsWs = new Regex(
@"\[\(h\)\]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句冒號和·-過多的
/// </summary>
private static readonly Regex IsWsM = new Regex(
@"\[·]|[-]|[::]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為BBS特征
/// </summary>
private static readonly Regex IsBbsInfo = new Regex(
@"第[^樓]{1,50}樓|Powered\s*/?by[\s\S]*?Dvbbs|Powered\s*/?by[\s\S]*?Discuz",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取KEYWORD
/// </summary>
private static readonly Regex mKeyWord = new Regex(
@"<meta\s*name\s*=\s*['""]?keywords['""]?\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?\s*name\s*=\s*['""]?keywords['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取DESCRIPTION
/// </summary>
private static readonly Regex mDescription = new Regex(
@"<meta\s*name\s*=\s*['""]?description['""]?\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?\s*name\s*=\s*['""]?description['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取Tags
/// </summary>
private static readonly Regex mTag = new Regex(
@"<meta\s*name\s*=\s*['""]?tagwords['""]?\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?\s*name\s*=\s*['""]?tagwords['""]?\s*[^>]*>
", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句:后字符號過少,:號前無“說”字,:號后無"關于"
/// </summary>
private static readonly Regex IsWsMM = new Regex(
@"^[^說\s]{0,8}?[::].{0,10}$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的url標記
/// </summary>
private static readonly Regex txtUrl = new Regex(
@"當前URL為:http://(?<URL>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的錨點描述標記
/// </summary>
private static readonly Regex txtDescription = new Regex(
@"當前鏈接描述為:(?<Describe>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
///// <summary>
///// 取需要a標簽
///// </summary>
//private static readonly Regex cleanFirst = new Regex(
// @"([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])(?<Robbish1><a\s+[^>]*>)[^<]{1,6}(?<Robbish2></a>)([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
#endregion
 

CRM定制 辦公OA找沈陽易勢科技有限公司

沈陽團購網|營口網站制作|沈陽軟件公司|軟件定制|網站建設|加盟易勢|提交問題

日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www
欧美日韩免费在线观看| 国产精品国产三级国产普通话蜜臀 | 一区在线观看视频| 午夜精品久久久久久久99黑人| 农夫在线精品视频免费观看| 国产精品一区在线播放| 欧美一区二区三区的| 欧美日韩在线精品一区二区三区| 国产一区亚洲| 久久久综合精品| 国产精品人人做人人爽人人添| 亚洲深夜福利在线| 欧美aⅴ99久久黑人专区| 国产精品一区一区| 欧美在线免费播放| 国产精品国产a级| 午夜在线视频一区二区区别| 欧美精品麻豆| 亚洲视频网在线直播| 久久精品在线观看| 国产裸体写真av一区二区| 欧美一级大片在线观看| 欧美日韩精品免费观看视一区二区| 伊人成年综合电影网| 免费在线欧美黄色| 激情五月婷婷综合| 欧美暴力喷水在线| 在线免费观看视频一区| 欧美精品在线一区二区| 亚洲综合二区| 国产精品国产三级国产专区53 | 国产一区二区中文| 浪潮色综合久久天堂| 国内精品国语自产拍在线观看| 玖玖玖免费嫩草在线影院一区| 国模私拍一区二区三区| 免费在线看成人av| 亚洲性夜色噜噜噜7777| 欧美天堂亚洲电影院在线播放| 性色av一区二区三区| 国产精品久久久亚洲一区| 久久国产免费| 国产无一区二区| 欧美高清在线观看| 亚洲欧美日韩国产综合| 国产精品呻吟| 模特精品在线| 在线一区观看| 国产精品成人免费视频| 久久精品国产清高在天天线 | 久久激情五月激情| 国产日韩精品一区二区三区在线| 久久影院午夜论| 在线看成人片| 国产精品麻豆成人av电影艾秋 | 国产日韩精品电影| 欧美黄在线观看| 亚洲欧美日韩在线一区| 国产欧美亚洲精品| 欧美成人在线影院| 亚洲欧美成人一区二区在线电影| 国产精品视频男人的天堂| 女女同性精品视频| 性久久久久久久久| 一区在线免费| 国产精品久久久久一区| 欧美成人一区二区三区片免费| 午夜精品成人在线| 激情综合五月天| 国产精品国产三级国产普通话99 | 国产麻豆日韩| 欧美激情bt| 久久精品日产第一区二区三区| 国产专区综合网| 欧美视频一区在线观看| 久久久综合香蕉尹人综合网| 亚洲一区二区三区在线看| 国产日韩在线看片| 欧美日韩亚洲成人| 免费观看在线综合色| 欧美在线视频不卡| 极品尤物av久久免费看| 国产精品国产三级国产专播品爱网 | 欧美激情影院| 久久精品国产99| 亚洲综合视频在线| 韩国av一区二区三区四区| 国产精品久久久久影院色老大 | 欧美日韩www| 麻豆成人在线| 欧美一区三区三区高中清蜜桃| 一区二区三区在线视频播放| 国产精品色在线| 欧美日韩在线一区二区| 欧美二区不卡| 老牛嫩草一区二区三区日本| 久久国产精品久久久久久| 亚洲欧美精品| 亚洲影院免费| 亚洲视频一区| 在线中文字幕日韩| 在线播放视频一区| 国产一区深夜福利| 国产日韩欧美在线观看| 国产精品国色综合久久| 欧美日韩久久| 欧美另类99xxxxx| 欧美黄色成人网| 欧美成人资源| 欧美成人午夜视频| 女生裸体视频一区二区三区| 玖玖精品视频| 噜噜噜躁狠狠躁狠狠精品视频| 久久久久国产一区二区三区四区| 亚洲欧美日韩一区二区在线| 亚洲自拍偷拍色片视频| 亚洲午夜未删减在线观看| 精品二区视频| 在线欧美小视频| 伊人男人综合视频网| 悠悠资源网亚洲青| 中文日韩在线视频| 1024成人| 亚洲综合首页| 欧美一区二区三区精品电影| 亚洲欧美国内爽妇网| 午夜电影亚洲| 久久成人免费网| 久久久国产一区二区三区| 久久久亚洲精品一区二区三区| 久久精品一区二区三区中文字幕| 久久精品毛片| 久久综合伊人77777蜜臀| 久久夜色精品亚洲噜噜国产mv| 久久这里有精品视频| 蜜臀91精品一区二区三区| 模特精品裸拍一区| 欧美精品在线观看| 国产精品v日韩精品v欧美精品网站 | 国产精品日韩欧美一区二区| 国产精品久久久久久久久久久久| 国产精品人成在线观看免费| 国产日韩av高清| 狠狠色狠狠色综合系列| 有坂深雪在线一区| 亚洲午夜精品视频| 欧美伊人精品成人久久综合97| 久久黄色网页| 你懂的视频欧美| 欧美日韩99| 国产精品乱子久久久久| 国产亚洲一二三区| 亚洲网站啪啪| 久久国产精品久久久久久久久久| 麻豆精品91| 欧美日韩国产三区| 国产精品一区二区在线观看| 国内精品久久久久久久影视蜜臀 | 欧美www视频| 欧美日韩一区二区在线| 国产精品久久中文| 国语精品一区| 小嫩嫩精品导航| 老**午夜毛片一区二区三区| 欧美日本一区二区三区| 国产精品视频男人的天堂| 在线观看国产成人av片| 欧美影院久久久| 欧美成人一区在线| 国产精品久久久久99| 激情久久久久久久久久久久久久久久| 亚洲一二三区视频在线观看| 久久久www成人免费精品| 欧美精品在线免费| 国产日韩欧美另类| 亚洲综合日韩在线| 老牛国产精品一区的观看方式| 欧美日韩亚洲综合| 国产一区二区在线免费观看| 午夜精品久久久久| 欧美顶级艳妇交换群宴| 国产日韩欧美中文| 亚洲欧美中文日韩v在线观看| 美女主播一区| 国产农村妇女精品一区二区| 亚洲一区精品视频| 美女任你摸久久| 国产精品亚洲不卡a| 亚洲永久字幕| 欧美电影资源| 国产在线不卡精品| 久久精品欧美日韩精品| 欧美日韩在线精品| 亚洲视频成人| 欧美国产日产韩国视频| 国产一区二区精品久久91| 欧美在线视频免费| 欧美性天天影院| 亚洲一区二区三区四区在线观看 | 国产亚洲一级|