我要投稿

XS52关关采集规则

举个栗子网站

2018-03-30 0 3,655 百度已收录

XS52关关采集规则，可以使用

介绍一下关关采规则当中需要用到的一些标签
\d* 表示数字 \s* 表示空格+换行 .+? 表示字符(不能为空) .* 表示字符(可以为空)
() 表示我们需要的部分 ((.|\n)*) 章节的内容部分，包括了换行。
=====与杰奇后台标签的对应关系=====
!!!! 相当于 ([^><]*) 　　~~~~ 相当于 ([^><‘”]*) 　　^^^^ 相当于 ([^><\d]*)
$$$$ 相当于 ([\d]*)
**** 相当于 (.*)
如果不行。就根据相关提示调整复制代码保存为xml文件。放在关关规则文件夹里。在关关里面选择即可，规则适用于V1.20.7.9版本，关关文件夹日期：2016.4.28这个版本的关关。

<?xml version="1.0"?>
<RuleConfigInfo xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
 <RuleVersion>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>2602126172</Pattern>
 <RegexName>RuleVersion</RegexName>
 </RuleVersion>
 <RuleID>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>92</Pattern>
 <RegexName>RuleID</RegexName>
 </RuleID>
 <GetSiteName>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>xs52</Pattern>
 <RegexName>GetSiteName</RegexName>
 </GetSiteName>
 <GetSiteCharset>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>utf-8</Pattern>
 <RegexName>GetSiteCharset</RegexName>
 </GetSiteCharset>
 <GetSiteUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://www.xs52.com/</Pattern>
 <RegexName>GetSiteUrl</RegexName>
 </GetSiteUrl>
 <NovelSearchUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://www.xs52.com/modules/article/search.php</Pattern>
 <RegexName>NovelSearchUrl</RegexName>
 </NovelSearchUrl>
 <NovelSearchData>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>NovelSearchData</RegexName>
 </NovelSearchData>
 <NovelSearch_GetNovelKey>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>NovelSearch_GetNovelKey</RegexName>
 </NovelSearch_GetNovelKey>
 <NovelListUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://www.xs52.com/booksort11/1.html</Pattern>
 <RegexName>NovelListUrl</RegexName>
 </NovelListUrl>
 <NovelListFilter>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>NovelListFilter</RegexName>
 </NovelListFilter>
 <NovelList_GetNovelKey>
 <FilterPattern />
 <Method>Match</Method>
 <Options>Singleline</Options>
 <Pattern>&lt;td class="odd"&gt;&lt;a href="http://www.xs52.com/xiaoshuo/\d+/(\d+)/" rel="external nofollow"  target="_blank"&gt;.+?&lt;/a&gt;&lt;/td&gt;</Pattern>
 <RegexName>NovelList_GetNovelKey</RegexName>
 </NovelList_GetNovelKey>
 <NovelUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://m.xs52.com/xs{NovelKey}.html</Pattern>
 <RegexName>NovelUrl</RegexName>
 </NovelUrl>
 <NovelErr>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>对不起，该文章不存在！</Pattern>
 <RegexName>NovelErr</RegexName>
 </NovelErr>
 <NovelName>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>:book_name" content="(.+?)"/&gt;</Pattern>
 <RegexName>NovelName</RegexName>
 </NovelName>
 <NovelAuthor>
 <FilterPattern>&lt;a.+?&gt;
&lt;/a&gt;
&amp;nbsp;</FilterPattern>
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>og:novel:author" content="(.+?)"/&gt;</Pattern>
 <RegexName>NovelAuthor</RegexName>
 </NovelAuthor>
 <LagerSort>
 <FilterPattern>&lt;a.+?&gt;
&lt;/a&gt;
&amp;nbsp;</FilterPattern>
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>og:novel:category" content="(.+?)"/&gt;</Pattern>
 <RegexName>LagerSort</RegexName>
 </LagerSort>
 <SmallSort>
 <FilterPattern>&lt;a.+?&gt;
&lt;/a&gt;
&amp;nbsp;</FilterPattern>
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>og:novel:category" content="(.+?)"/&gt;</Pattern>
 <RegexName>SmallSort</RegexName>
 </SmallSort>
 <NovelIntro>
 <FilterPattern>&lt;script((.|\n)*?)&lt;/script&gt;
&amp;lt;♂&lt;
&amp;gt;♂&gt;
&lt;a.+?&lt;/a&gt;
</FilterPattern>
 <Method>Match</Method>
 <Options>IgnoreCase</Options>
 <Pattern>&lt;meta property="og:description" content="(.+?)"/&gt;</Pattern>
 <RegexName>NovelIntro</RegexName>
 </NovelIntro>
 <NovelKeyword>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>NovelKeyword</RegexName>
 </NovelKeyword>
 <NovelDegree>
 <FilterPattern>a♂已完结
b♂连载中</FilterPattern>
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>og:novel:status" content="(.+?)"/&gt;</Pattern>
 <RegexName>NovelDegree</RegexName>
 </NovelDegree>
 <NovelCover>
 <FilterPattern />
 <Method>Spilt</Method>
 <Options>None</Options>
 <Pattern>&lt;img src="(.+?)" border="0"</Pattern>
 <RegexName>NovelCover</RegexName>
 </NovelCover>
 <NovelDefaultCoverUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>noimg.jpg</Pattern>
 <RegexName>NovelDefaultCoverUrl</RegexName>
 </NovelDefaultCoverUrl>
 <NovelInfo_GetNovelPubKey>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://www.xs52.com/xiaoshuo/\d*/(\d*)/</Pattern>
 <RegexName>NovelInfo_GetNovelPubKey</RegexName>
 </NovelInfo_GetNovelPubKey>
 <PubCookies>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubCookies</RegexName>
 </PubCookies>
 <PubIndexUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>http://www.xs52.com/xiaoshuo/{NovelKey/1000}/{NovelKey}/</Pattern>
 <RegexName>PubIndexUrl</RegexName>
 </PubIndexUrl>
 <PubIndexErr>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>获得目录页错误</Pattern>
 <RegexName>PubIndexErr</RegexName>
 </PubIndexErr>
 <PubVolumeContent>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubVolumeContent</RegexName>
 </PubVolumeContent>
 <PubVolumeSplit>
 <FilterPattern />
 <Method>Spilt</Method>
 <Options>None</Options>
 <Pattern>&lt;h3</Pattern>
 <RegexName>PubVolumeSplit</RegexName>
 </PubVolumeSplit>
 <PubVolumeName>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>&gt;(.+?)&lt;/h3&gt;</Pattern>
 <RegexName>PubVolumeName</RegexName>
 </PubVolumeName>
 <PubChapterName>
 <FilterPattern>~伪后记~|伪后记</FilterPattern>
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>&lt;div class="chapter_list_chapterx" style="height:28px;"&gt;&lt;a href="\d+.html" rel="external nofollow" &gt;(.+?)&lt;/a&gt;</Pattern>
 <RegexName>PubChapterName</RegexName>
 </PubChapterName>
 <PubChapter_GetChapterKey>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>&lt;div class="chapter_list_chapterx" style="height:28px;"&gt;&lt;a href="(.+?)" rel="external nofollow" &gt;.+?&lt;/a&gt;</Pattern>
 <RegexName>PubChapter_GetChapterKey</RegexName>
 </PubChapter_GetChapterKey>
 <PubContentUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>{ChapterKey}</Pattern>
 <RegexName>PubContentUrl</RegexName>
 </PubContentUrl>
 <PubContentErr>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>获得章节内容页错误</Pattern>
 <RegexName>PubContentErr</RegexName>
 </PubContentErr>
 <PubTextUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubTextUrl</RegexName>
 </PubTextUrl>
 <PubContentText>
 <FilterPattern>记住本站网址，Ｗｗｗ．XS52．Ｃｏｍ，方便下次阅读，或且百度输入“ xs52 ”，就能进入本站）|&lt;span.+?&gt;|&lt;font.+?&gt;|&lt;[Ss][Cc][Rr][Ii][Pp][Tt](.|\n)+?&lt;/[Ss][Cc][Rr][Ii][Pp][Tt]&gt;|&lt;[Ff][Oo][Nn][Tt](.|\n)*?&lt;/[Ff][Oo][Nn][Tt]&gt;|&lt;[Ii][Ff][Rr][Aa][Mm][Ee](.|\n)+?&lt;/[Ii][Ff][Rr][Aa][Mm][Ee]&gt;|&lt;[Aa].+?&lt;/[Aa]&gt;|&lt;[Dd][Ii][Vv].+?&gt;|&lt;/[Dd][Ii][Vv]&gt;|&lt;!--.+?--&gt;|&lt;[Ss&gt;][Pp][Aa][Nn](.|\n)*?&lt;/[Ss&gt;][Pp][Aa][Nn]&gt;|0.{0,10}0.{0,10}小.{0,10}说|&lt;/br&gt;|&lt;br&gt;|本書首发于看書罔|未完待续|&lt;/span&gt;|&lt;/&gt;|&lt;/font&gt;|\[\$|妙\]|\[笔|\$|i\]|\[-阁\]|coｍ|\(。\)|U8\?小说|\?．\?|Ｕ\?８\?Ｘ\?Ｓ|\?U\?|8\?小说|Ｕ\?８\?Ｘ|Ｓ\?|\?U8|小说|Ｕ|８|\?Ｘ\s*\?|\?\?U|8小|说\?|Ｘ|Ｓ`|[WwMm]+\.[0-9a-zA-Z]*\.[CcOoMmIiNnEeTtLlAa]|手机用户|请浏览|m.114zw.la|阅读|更优质的阅读体验|天才壹秒記住|114|中文网|』|ф|①|④ω|ｚ|la|呅網|為您|提供精彩|小說閱讀|『|起点读书|最快更新|无弹窗请|xs52|XS52|&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp|</FilterPattern>
 <Method>Match</Method>
 <Options>Singleline</Options>
 <Pattern>&lt;div id="text_c"&gt;((.|\n)+?)&lt;/div&gt;</Pattern>
 <RegexName>PubContentText</RegexName>
 </PubContentText>
 <PubContentPageUrl>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubContentPageUrl</RegexName>
 </PubContentPageUrl>
 <PubContentPageKey>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubContentPageKey</RegexName>
 </PubContentPageKey>
 <PubContentReplace>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern>[WwＷｗωщщψшШ].{0,3}[WwＷｗωщщψшШ].{0,3}[WwＷｗωщщψшШ].{0,3}[0０OoＯｏο].{0,3}[0０OoＯｏο].{0,3}[XxＸｘχ].{0,3}[SsＳｓ].{0,7}[CcＣｃСΓ].{0,3}[0０OoＯｏοó].{0,3}[MmＭｍМ]|[0０OoＯｏο].{0,3}[0０OoＯｏο].{0,3}[XxＸｘχ].{0,3}[SsＳｓ].{0,7}[CcＣｃСΓ].{0,3}[0０OoＯｏοó].{0,3}[MmＭｍМ]|[HhＨΗｈ].{0,3}[TtＴｔ].{0,3}[TtＴｔ].{0,3}[PpＰｐρр]://|[WwＷｗωщщψ].{0,3}[WwＷｗωщщψ].{0,3}[WwＷｗωщщψ]|[WwＷｗωщщψ].{0,3}[AaàＡａαа].{0,3}[PpＰｐρр]|[CcＣｃС].{0,3}[0０OoＯｏο].{0,3}[MmＭｍМ]|[NnＮｎΠ∩η].{0,3}[EeＥｅε].{0,3}[TtＴｔ]|[0０OoＯｏο].{0,3}[RrＲｒ].{0,3}[GgＧｇ]|[CcＣｃС].{0,3}[NnＮｎΠ∩η]</Pattern>
 <RegexName>PubContentReplace</RegexName>
 </PubContentReplace>
 <PubContentChapterName>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubContentChapterName</RegexName>
 </PubContentChapterName>
 <PubContentChapterNum>
 <FilterPattern />
 <Method>Match</Method>
 <Options>None</Options>
 <Pattern />
 <RegexName>PubContentChapterNum</RegexName>
 </PubContentChapterNum>
</RuleConfigInfo>

收藏 (0) 打赏

感谢您的支持，我会继续努力的!