本来想写一篇详细一点的SDCMS采集器使用教程,一直没时间去完成后面部分,先简单分享一些采集器的使用心得。主要是面向一些使用采集器的初级用户,因为SDCMS官方并没有给出采集器的教程,对于没有使用过采集器的朋友可能有些困难,下面简单罗列一些采集的说明,比较重要的是前面URL列表方面的设置,大多采集不成功都是在这里设置出了错。
一、远程URL列表地址
你需要采集的网页地址所在页面,比如采集某个分类下的文章,则将该分类的URL地址填入即可。
二、列表开始代码、结束代码
1、缩小需要采集的URL列表的位置,这个位置通过“列表前的标志代码”跟“列表后的标志代码”进行限定,SDCMS里叫列表开始代码、结束代码,如果不做限制直接填写该页面的顶部第一句代码为列表开始代码,页面底部的最后一句代码为列表结束代码基本等于不做限制,将采集本页面的所有URL连接。
2、链接开始代码:这个值是取得<a href="http://****url"></a>href里的属性值。
设置规则:
开始:<a href="
结束: ">
设置规则:
开始:<a href="
结束: ">
这点是最重要的,我们要采集的是红色部分的URL地址,设置规则就如上。完成以上两步基本上都可以成功采集到内容了,如果内容为flase则是第三步里的采集规则没有设置好。
本文介绍的比较简单,有不清楚的欢迎给我留言。