多页处理:默认首页被替换的字符
(如留空,内容如有多页将不采集直接跳过)
比如:
第一页http://qibosoft.com/1/index.html
第二页http://qibosoft.com/1/index_2.html
那么右边的表单填.html
分析规则就是对比第一页与第二页的网址从左到右哪个字符出现不同,就把之后的字符复制出来 |
|
多页处理:变动的页去替换的字符
(留空,内容如有多页将不采集直接跳过)
比如:
第一页http://qibosoft.com/1/index.html
第二页http://qibosoft.com/1/index_2.html
那么右边的表单填_[page].html
分析规则就是对比第一页与第二页的网址从左到右哪个字符出现不同,就把第二页之后的字符复制出来,并把变动的页码数字用[page]替换 |
|
多页时.第二页是否怪癖,
比如:
第一页http://qibosoft.com/1/index.html
第二页http://qibosoft.com/1/index_1.html
此时属于怪癖的,按常理说应该是以下这个
http://qibosoft.com/1/index_2.html
所以右边请选择是,一般情况都是选否的 |
是
否 |