隔一段时间会分享一个关关采集规则,本规则利用V1.20.7.9版本编写。最好是有这个版本的关关采集器,
老规矩,先介绍下几个正则符号用法。简单方便。可以自己写
介绍一下关关采规则当中需要用到的一些标签
\d* 表示数字 \s* 表示空格+换行 .+? 表示字符(不能为空) .* 表示字符(可以为空)
() 表示我们需要的部分 ((.|\n)*) 章节的内容部分,包括了换行。
=====与杰奇后台标签的对应关系=====
!!!! 相当于 ([^><]*) ~~~~ 相当于 ([^><‘”]*) ^^^^ 相当于 ([^><\d]*)
$$$$ 相当于 ([\d]*)
**** 相当于 (.*)
如果不行。就根据相关提示调整 复制代码保存为 xml 文件。放在关关规则文件夹里。在关关里面选择即可,规则适用于 V1.20.7.9 版本,关关文件夹日期:2016.4.28 这个版本的关关。
[v_error]注:2019年2月24日规则有调整[/v_error]
Match None m.lizi.tw小说网 RuleVersion Match None 91 RuleID Match None sanjiangge GetSiteName Match None gbk GetSiteCharset Match None https://www.sanjiangge.com/ GetSiteUrl Match None NovelSearchUrl Match None NovelSearchData Match None NovelSearch_GetNovelKey Match Singleline https://www.sanjiangge.com/ NovelListUrl Match None Match None <a href="/book/\d+/(\d+)/index.html">(.+?)</a></span><span class="s3"> NovelList_GetNovelKey Match None https://www.sanjiangge.com/book/{NovelKey/1000}/{NovelKey}/index.html NovelUrl Match None 对不起,该文章不存在! NovelErr Match None og:novel:book_name" content="(.+?)" NovelName <a.+?> </a> Match None og:novel:author" content="(.+?)" NovelAuthor <a.+?> </a> Match None <p>类 别:(.+?)</p> LagerSort <a.+?> </a> Match None <p>类 别:(.+?)</p> SmallSort <script((.|\n)*?)</script> <♂< >♂> <a.+?</a> </div> </p> Match None <meta property="og:description" content="(.+?)"/> NovelIntro Match None og:novel:book_name" content="(.+?)" NovelKeyword a♂已完结 b♂连载中 Match None og:novel:status" content="(.+?)" NovelDegree Match Singleline <div id="fmimg"><img alt=".+?" src="(.+?)" /></div> NovelCover Match None noimg.jpg NovelDefaultCoverUrl Match Singleline <meta property="og:novel:read_url" content="(.+?)"/> NovelInfo_GetNovelPubKey Match None PubCookies Match None {NovelPubKey} PubIndexUrl Match None 获得目录页错误 PubIndexErr Match None PubVolumeContent Spilt None <h3 PubVolumeSplit Match None >(.+?)</h3> PubVolumeName ~伪后记~|伪后记 Match None <dd><a href="\d*.html" title=".+?">(.+?)</a></dd> PubChapterName Match None <dd><a href="(\d*.html)" title=".+?">.+?</a></dd> PubChapter_GetChapterKey Match None {ChapterKey} PubContentUrl Match None 获得章节内容页错误 PubContentErr Match None PubTextUrl 章节内容结束 章节内容开始 <!----> </div> <div> Match None <div id="content" name="content">\s*((.|\n)+?)\s*</div>\s*<div class="bottem"> PubContentText Match None Match None Match None [WwWwωщщψшШ].{0,3}[WwWwωщщψшШ].{0,3}[WwWwωщщψшШ].{0,3}[00OoOoο].{0,3}[00OoOoο].{0,3}[XxXxχ].{0,3}[SsSs].{0,7}[CcCcСΓ].{0,3}[00OoOoοó].{0,3}[MmMmМ]|[00OoOoο].{0,3}[00OoOoο].{0,3}[XxXxχ].{0,3}[SsSs].{0,7}[CcCcСΓ].{0,3}[00OoOoοó].{0,3}[MmMmМ]|[HhHΗh].{0,3}[TtTt].{0,3}[TtTt].{0,3}[PpPpρр]://|[WwWwωщщψ].{0,3}[WwWwωщщψ].{0,3}[WwWwωщщψ]|[WwWwωщщψ].{0,3}[AaàAaαа].{0,3}[PpPpρр]|[CcCcС].{0,3}[00OoOoο].{0,3}[MmMmМ]|[NnNnΠ∩η].{0,3}[EeEeε].{0,3}[TtTt]|[00OoOoο].{0,3}[RrRr].{0,3}[GgGg]|[CcCcС].{0,3}[NnNnΠ∩η] PubContentReplace Match None PubContentChapterName Match None
© 版权声明
内容来源于网络或本站原创,如有任何问题请联系站长
THE END