列表网址规则文章网址规则其他设置 基本信息 采集项目名: 采集页面编码: value="utf-8"> UTF-8 value="gbk"> GBK 列表规则 网址类型: value="1"> 序列网址 value="2"> 单一网页 网址配置: (如为序列网址:http://www.yzmcms.com/html/(*).html,页码使用(*)做为通配符。 页码从: 到 每次增加 网址配置: 网址中必须包含 网址中不得包含 获取网址: 区域开始的HTML: 区域结束的HTML: 标题规则 匹配规则: 使用“[内容]”作为通配符 过滤选项: 使用“[|]”分隔多个规则 选择: <p> <a> <script> <iframe> <table> <span> <b> <img> <object> <embed> <param> <div> </div> <!-- --> 时间规则 匹配规则: 使用“[内容]”作为通配符 过滤选项: 使用“[|]”分隔多个规则 选择: <p> <a> <script> <iframe> <table> <span> <b> <img> <object> <embed> <param> <div> </div> <!-- --> 内容规则 匹配规则: 使用“[内容]”作为通配符 过滤选项: 使用“[|]”分隔多个规则 选择: <p> <a> <script> <iframe> <table> <span> <b> <img> <object> <embed> <param> <div> </div> <!-- --> 其他设置 下载图片: >下载图片 >不下载 导入顺序: >与目标站相同 >与目标站相反