日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www

注冊|登錄

聯系電話:024-31891684  13390130939
沈陽軟件公司--沈陽軟件定制

沈陽軟件開發_沈陽軟件公司_沈陽軟件定制/軟件/最新技術

Latest technology最新技術

辦公OA--正文提取中用到的正則表達式

瀏覽量:2608

CRM定制 辦公OA

#region 相關正則表達式

 
/// <summary>
/// 去掉所有html標簽
/// </summary>
private static readonly Regex FilterAll = new Regex(
@"(\[([^=]*)(=[^\]]*)?\][\s\S]*?\[/\1\])|(?<lj>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");])<a\s+[^>]*>[^<]{2,}</a>(?=[^\u4E00-\u9FA5\uFE30-\uFFA0,."");]))|(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)|(\&\#\d+\;)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase); //(?<Link><a[\s\S]*?</a>)|
//(?<Style><style[\s\S]+?/style>)|(?<select><select[\s\S]+?/select>)|(?<Script><script[\s\S]*?/script>)|(?<Explein><\!\-\-[\s\S]*?\-\->)|(?<li><li(\s+[^>]+)?>[\s\S]*?/li>)|(?<Html></?\s*[^> ]+(\s*[^=>]+?=['""]?[^""']+?['""]?)*?[^\[<]*>)|(?<Other>&[a-zA-Z]+;)|(?<Other2>\#[a-z0-9]{6})|(?<Space>\s+)
 
/// <summary>
/// 找出title標簽
/// </summary>
private static readonly Regex FindTitle = new Regex(
@"<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出title標簽內容
/// </summary>
private static readonly Regex FindTitleContent = new Regex(
@"<\s*/?title\s*>(?<Content>[\s\S]*?)<\s*/?title\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出h 和Strong標簽
/// </summary>
private static readonly Regex FindHStrong = new Regex(
@"<\s*/?h\s*>|<\s*/?strong\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出p 和br標簽
/// </summary>
private static readonly Regex FindPB = new Regex(
@"<\s*/?p\s*>|<\s*br\s*/?>|<\s*/?tr\s*>",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出nbsp標簽
/// </summary>
private static readonly Regex FindNbsp = new Regex(
@"&nbsp",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出結尾標簽
/// </summary>
private static readonly Regex FindS = new Regex(
@"(?<Content>[\s\S]*?)\$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為標準句
/// </summary>
private static readonly Regex IsSen = new Regex(
@"[,.,。!!;;::……??《》“”""]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句[strong][h]標簽過多的
/// </summary>
private static readonly Regex IsWs = new Regex(
@"\[\(h\)\]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句冒號和·-過多的
/// </summary>
private static readonly Regex IsWsM = new Regex(
@"\[·]|[-]|[::]",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為BBS特征
/// </summary>
private static readonly Regex IsBbsInfo = new Regex(
@"第[^樓]{1,50}樓|Powered\s*/?by[\s\S]*?Dvbbs|Powered\s*/?by[\s\S]*?Discuz",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取KEYWORD
/// </summary>
private static readonly Regex mKeyWord = new Regex(
@"<meta\s*name\s*=\s*['""]?keywords['""]?\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<KeyWords>[^'"">]*)['""]?\s*name\s*=\s*['""]?keywords['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取DESCRIPTION
/// </summary>
private static readonly Regex mDescription = new Regex(
@"<meta\s*name\s*=\s*['""]?description['""]?\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<description>[^'"">]*)['""]?\s*name\s*=\s*['""]?description['""]?\s*[^>]*>
",RegexOptions.ExplicitCapture| RegexOptions.Multiline| RegexOptions.IgnoreCase);
 
/// <summary>
/// 取Tags
/// </summary>
private static readonly Regex mTag = new Regex(
@"<meta\s*name\s*=\s*['""]?tagwords['""]?\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?[^>]*>|<meta\s*content\s*=\s*['""]?(?<tagwords>[^'"">]*)['""]?\s*name\s*=\s*['""]?tagwords['""]?\s*[^>]*>
", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出是否為垃圾句:后字符號過少,:號前無“說”字,:號后無"關于"
/// </summary>
private static readonly Regex IsWsMM = new Regex(
@"^[^說\s]{0,8}?[::].{0,10}$",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的url標記
/// </summary>
private static readonly Regex txtUrl = new Regex(
@"當前URL為:http://(?<URL>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
/// <summary>
/// 找出spider寫入的錨點描述標記
/// </summary>
private static readonly Regex txtDescription = new Regex(
@"當前鏈接描述為:(?<Describe>.*)",
RegexOptions.ExplicitCapture
| RegexOptions.Multiline
| RegexOptions.IgnoreCase);
 
///// <summary>
///// 取需要a標簽
///// </summary>
//private static readonly Regex cleanFirst = new Regex(
// @"([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])(?<Robbish1><a\s+[^>]*>)[^<]{1,6}(?<Robbish2></a>)([\u4E00-\u9FA5]|[\uFE30-\uFFA0]|[,."");])", RegexOptions.ExplicitCapture | RegexOptions.Multiline | RegexOptions.IgnoreCase);
 
#endregion

沈陽團購網|營口網站制作|沈陽軟件公司|軟件定制|網站建設|加盟易勢|提交問題

日韩精品免费一区二区三区_久久精品国产三级不卡_免费观看中文字幕_好男人社区神马在线观看www
久久视频国产精品免费视频在线 | 国产精品麻豆va在线播放| 国产精品视频yy9299一区| 国产亚洲欧洲997久久综合| 亚洲午夜在线观看视频在线| 裸体一区二区| 国产精品视频一区二区高潮| 亚洲网站在线播放| 免费观看在线综合色| 国产精品每日更新| 亚洲免费在线电影| 欧美精品色综合| 黄色在线一区| 久久视频免费观看| 国产精品永久免费观看| 亚洲欧美综合一区| 欧美日韩二区三区| 在线免费不卡视频| 欧美黄色免费| 韩国久久久久| 麻豆精品视频在线| 国产日韩欧美黄色| 久久久另类综合| 国产嫩草影院久久久久| 欧美专区中文字幕| 国产精品乱人伦一区二区| 亚洲欧美日韩国产| 欧美午夜一区| 欧美在线黄色| 国产精品午夜电影| 久久九九99视频| 国产精品亚洲综合色区韩国| 久久精品国产99国产精品澳门| 国产精品久久久久久久久免费樱桃| 先锋资源久久| 国产精品稀缺呦系列在线| 久久国产精品电影| 国产午夜精品视频免费不卡69堂| 久久亚洲私人国产精品va媚药 | 欧美先锋影音| 欧美影院久久久| 国产精品夜夜嗨| 久久综合亚州| 一区二区在线看| 欧美精品播放| 午夜视频久久久| 国产精品每日更新| 久久综合电影| 一色屋精品亚洲香蕉网站| 欧美伦理一区二区| 性欧美xxxx视频在线观看| 国产精品国产三级国产普通话99 | 国产精品区二区三区日本| 久久久国产91| 一区二区在线观看视频在线观看| 欧美日本成人| 久久成人精品视频| 国内久久精品| 欧美日韩一区二区三区在线| 欧美一区二区三区成人| 国产性色一区二区| 欧美激情一区二区三区在线视频| 午夜欧美视频| 韩国精品在线观看| 欧美三级欧美一级| 久久久久久久综合狠狠综合| 影视先锋久久| 国产精品视频不卡| 欧美高清视频www夜色资源网| 亚洲欧美第一页| 国产在线成人| 欧美午夜精品久久久久久超碰| 久久久天天操| 亚洲免费在线| 黄网动漫久久久| 国产精品成人一区| 美女黄网久久| 欧美亚洲在线观看| 一区二区亚洲精品国产| 国产精品一区二区你懂得 | 精品福利电影| 国产精品一区二区男女羞羞无遮挡 | 国产视频久久久久| 欧美日本韩国一区二区三区| 久久久久九九九| 亚洲欧美另类在线| 国内精品久久久久久 | 美女国产一区| 欧美在线视频一区二区三区| 在线观看亚洲视频啊啊啊啊| 国产伦精品一区二区| 欧美日韩麻豆| 欧美成人国产va精品日本一级| 午夜精品国产精品大乳美女| 国产精品久久久久一区| 欧美成人黑人xx视频免费观看| 久久aⅴ国产欧美74aaa| 亚洲一区免费视频| 在线观看欧美激情| 国产日本欧美在线观看| 午夜久久tv| 国产欧美韩国高清| 欧美日产在线观看| 欧美成人精品不卡视频在线观看 | 亚洲欧美日韩一区二区在线| 狠久久av成人天堂| 国产精品一二| 欧美一区2区三区4区公司二百| 久久综合九色综合欧美就去吻| 欧美日本国产| 国际精品欧美精品| 欧美影院在线播放| 国产在线精品二区| 欧美人与性动交α欧美精品济南到| 欧美在线视频免费播放| 伊人蜜桃色噜噜激情综合| 欧美喷水视频| 免费av成人在线| 性亚洲最疯狂xxxx高清| 在线精品高清中文字幕| 国产一区日韩欧美| 国产精品久久久久毛片大屁完整版| 久久久www免费人成黑人精品 | 在线一区视频| 国产精品国产福利国产秒拍| 美女主播一区| 久久在线播放| 久久午夜av| 久久综合九色综合网站| 欧美资源在线| 久久九九国产| 亚洲一品av免费观看| 国内自拍视频一区二区三区| 国产精品视频不卡| 国产精品欧美久久久久无广告| 国产精品av久久久久久麻豆网| 亚洲欧美一区二区三区在线| 亚洲视频导航| 亚洲一区在线直播| 黄网站免费久久| 欧美大片91| 欧美激情一二三区| 欧美日韩国产综合视频在线观看| 久久精品盗摄| 玖玖视频精品| 欧美mv日韩mv国产网站app| 亚洲欧美影音先锋| 欧美一区二区视频97| 亚洲一区二区三区在线看| 亚洲欧美激情一区二区| 午夜精品久久久久久久| 欧美一区二区三区免费视频| 久久久www| 欧美成人情趣视频| 国产精品午夜在线观看| 欧美午夜精品久久久久久超碰| 国产精品乱码一区二三区小蝌蚪 | 久久久久综合| 欧美a一区二区| 欧美久久成人| 噜噜噜91成人网| 久久嫩草精品久久久精品一| 久久久久久久久一区二区| 欧美freesex8一10精品| 激情久久久久久久| 狠狠色丁香久久婷婷综合丁香| 亚洲视频欧美在线| 羞羞答答国产精品www一本 | 欧美一区在线直播| 久久亚洲高清| 欧美日韩国产综合久久| 国产欧美日韩精品a在线观看| 精品成人乱色一区二区| 午夜精品影院| 欧美电影在线播放| 国产精品久久久久久超碰 | 亚洲自拍另类| 久久免费黄色| 欧美日韩在线播放三区| 国产一区二区三区不卡在线观看| 亚洲少妇最新在线视频| 久久久久久一区| 欧美日韩一区免费| 国产综合欧美| 久久精品国产69国产精品亚洲| 欧美成人精品福利| 国产欧美日韩综合精品二区| 亚洲一区二区三区视频| 老司机精品久久| 国产精品久久久久一区二区| 亚洲色诱最新| 美女黄毛**国产精品啪啪| 国产精品色在线| 亚洲在线播放| 久久综合网hezyo| 国产精品免费看久久久香蕉| 国产精品99久久久久久久久| 老司机成人在线视频| 国产精品一区视频| 午夜一区不卡|