的目标站。。discuz!x15架构的网站。。。httpwwwyq90c
forum601html我们要把这个版块的内容以及回复都采集到我们的网站上去。。。首先我们打开火车,新建一个站点。。。点击火车左上角上的新建按钮,选择新建站点。。。如下图
我们只需要填写站点名就可以,其余的保持默认,然后点击保存按钮!
然后。。。在这个站点下,新建一个任务。。。选中我们新建的站点,点击鼠标右键,选择第一个,从该站点新建任务。。。如下图
f其中1,是任务的名字,必须填写。。。2,是整个采集任务的步骤向导,3,是文章列表的设置区域(下边讲解),4,和3差不多。。。5,是登录的地方,有些网址必须登录,我们才可以看到内容,就是这个东西!OK。就这些,那么,我们一步一步的来!首先我们给我们的任务加一个标题。。。
下一步,我们就开始设置列表的采集规则(因为现在火车不知道httpwwwyq90c
forum601html这个页面的文章列表是那些,所以我们要告诉火车!)
f这里有两种方式,新手嘛,我也不知道适合哪种。。。我们就用默认的吧,第一种
我们点击向导添加
然后出现下图。。
f其中有4个选项卡,如果我们只采集目标站点的一个文章列表httpwwwyq90c
forum601html,那么我们选中单条网址,直接写上目标的列表网站,如下图!
f然后点击添加,点击完成就OK。。那么,如果我们要采集多个列表。那么我们回到看下边的图
f其中1,是目标网站的地址其中2,是火车的通配符(就是某个东西识别的东西)其中3,是间隔数已经补零(下边一一讲解)其中4,数字变化。。。下边讲解其中5,字母变化。。。那么。。。看下图
f图中在地址栏填写的是httpwwwyq90c
forum60html这个。那么,这是什么意思呢?我们打开httpwwwyq90c
forum601html这个地址,然后点击下一页
发现地址变成了httpwwwyq90c
forum602html那么我们在点击下一页,就是第三页,发现地址变成了httpwwwyq90c
forum603html那么在点击第四页。。想必大家也知道变成什么了吧?那么第一页:httpwwwyq90c
forum601html第二页:httpwwwyq90c
forum602html第三页:httpwwwyq90c
forum603html翻页中,我们发现,只有1在变化。。。那
么我们在火车那里就填写httpwwwyq90c
forum60html这个,其中1用火车的通配符替换掉。。。意思就是,只有1在变化。。。在看下边
其中数字变化,从1到5意思就是从地址栏httpwwwyq90c
forum60htm获取地址1到5,就是下边这样的。。。httpwwwyq90c
forum601htmr