SyCms建站第四讲:采集功能配置教程

  • 时间:
  • 浏览:0
  • 来源:1分6合娱乐平台-1分6合下注平台_1分6合注册平台
作者:sycms hihi 来源:用户投稿 浏览: 2013-1-23 17:40:43 字号:大 中 小

[摘要]SyCms是国内自主开发的一款具有强大的数据负载能力的文章管理系统,本文介绍如可配置程序自带的采集功能。

  今天当我们来讲一下,配置SyCms上端的采集功能。

  当我们就采集网易的国内新闻,地址:http://news.163.com/domestic/

  当我们打开内容采集界面,如下图所示:

  采集名称里,当我们输入:网易-国内新闻

  网站编码,当我们查看当我们要采集的地址源代码里的什儿 地方。

  采集地址:当我们输入要采集的列表页地址,即:http://news.163.com/domestic/输入进去。

  防盗链在此暂时找不到使用。引用地址什么都 都不不 填写。

  采集顺序,当我们选泽,从旧到新的采集。

  填写后如下图所示:

  当我们单击“下一步”按钮,进入下一步界面。

  在此界面,当我们都不不 看了左边显示出了当我们要采集地址的页面,右边显示的是什儿 页面的形态学 ,当我们把鼠标移到右边不同的DIV上,这很久左边就会选泽显示出相应的区块。

  注:当我们在此看了界面上端有列表,分页,当我们现在要选泽的是列表信息,什么都当我们都不不 一步一步找以当我们要采集的列表地址。

  1.列表

  当我们单击鼠票经过 的什儿 右边DIV信息,突然总出 如下界面:

  这很久当我们看了,系统已给当我们分易挥发了要采集的最终页的地址。地址过滤里当我们都不不 设置其他是当我们要采集的地址很久是找不到采集地址范围内的地址信息。当然这次当我们先不写。

  这很久,当我们要默认读取的是“读取完整版”,要不就成了只读取两根信息了。

  选泽无误后,“选泽”,界面就显示如下图所示:

  此时当我们很久选泽了列表信息了,很久当我们要继续读取分页的很久,都不不 单击右上角“分页”,标示当我们要选泽分页的位置信息。

  2.分页

  鼠标在此单击,突然总出 如一界面。

系统很久自动为当我们分析了。一共10页,每页递增1,最低位数为2,跟地址显示的信息对比一下对不对,但此地址信息当我们看了,找不到01.html什儿 页面,什么都当我们分页现在现在开始要从第2页现在现在开始。很久选泽无误后“选泽”。

  当我们很久选泽了列表和分页信息了,当我们单击“下一步”,如下图所示:

  3.内容

  跟上原先界面差越多,展开右边,选泽相应的信息。

  3.1标题

  “单击”,突然总出 如下界面:

  填写完成很久,当我们单击“选泽”,界面如下所示:

  3.2加进去去时间

  看来加进去去时间找不到在这上端筛选出来了。

  原先当我们就筛选出当我们都不不 的新闻的加进去去时间了,“选泽”。

  3.3来源

  当我们看了此新闻还有来源,什么都当我们还是继续单击刚才选泽加进去去时间的地方,此时,很久突然总出 如下界面:

  此时,红色框内,当我们要查询“来源”字符,很久 要保证“来源”选泽,原先不不 保证信息的正确性。很久有很久,找不到来源的很久。“来源”字符什么都 指在。当我们“选泽”。

  3.4内容

  最后一步,当我们要提取内容了,当我们选泽,如下图:

  此时当我们操作如下界面功能:

  很久 当我们看了内容的最后有原先,本文来源,什么都当我们都不不 配置特殊取值,最终如下图所示:

  很久是当我们很久的效果,选泽即可。

  3.5摘要

  当我们看了界面上还有搞要内容,但当我们也都不不 不使用上端的摘要,保存的很久,自动把内容取几只字符为搞要,当然了。很久随便说说这上端的摘要比较好,当我们还是都不不 取摘要的。

  如下图:

  如终效果如下图所示:

  此时很久找不到要修改的,当我们单击“选泽”,完成此次的采集配置,当然了,当我们也都不不 选泽内容上端的“分页”功能,很久内容有分页的很久。都不不 配置分页,当然什儿 也要看当我们采集的内容有找不到分页了,暂定这次找不到分页,什么都当我们找不到去配置此分页。很久很久看看其它页面的效果,当我们都不不 单击,“内容”前面的下拉框换个页面查看一下。

  4.采集

  完成很久,当我们选泽“采集”。

  系统就会根据当我们设置的采集信息,进行内容的采集了。当采集完成很久,当我们单击列表的“名称”什儿 列,当我们就进入了相应采集的内容列表。

  当我们都不不 单击修改,查看当我们采集到的结果。

  不错。当我们采集的还很正常,这很久,当我们要设置否有导出有有哪些内容了。

  5.导出

  单击列表上端的“设置导出规则”。

  当我们选泽导出到新闻模型,“选泽”。

  当我们根据实际情况报告,一一对应选泽即可,选泽完成后“选泽”。

  这很久,当我们看了列表页上的“导出内容”不不 用了,当我们单击“导出内容”,很久当我们选泽了图片本地化,很久会慢其他。

  最后当我们去当我们导出到的栏目查看一下,所有的内容都会 这显示了,单击开原先查看一下。

  都找不到现象,到此当我们的采集工作就算完成了。

  很久当我们想有配图的很久,当我们都不不 在设置导出的很久,内容的选项中设置成原先即可。

  当我们再试一下。

  此时比较麻烦其他了,很久所有的内容都采集完成了,都不不 当我们手动删除所有的内容,包括采集的内容,才不不 重新采集如库。

  再次导出成功后,当我们查看一下栏目列表页,如下图:

  此时,就很久有配图指在了,当我们单击开有配图的新闻。

sssss
Tags: SyCms   建站第四讲   采集配置教程  
责任编辑:mozi