dedecms如何采集文章 dedecms采集规则

dedecms如何采集文章——简介
dedecms如何采集文章 dedecms采集规则

如果要从其他站点转载文章,我们无需复制来复去,dedecms自带了文章和图片采集功能,对于不熟悉的人员来,采集规则配置起来很麻烦,常常在采集时出错,或者乱码,现在就向大家介绍dedecms的采集功能。

dedecms如何采集文章——方法/步骤

dedecms如何采集文章 1、

打开新增节点菜单

打开后台->采集->采集节点管理,点击增加新节点


dedecms如何采集文章 2、

选择模型


dedecms如何采集文章 3、

新增节点-配置网址索引

填写要采集的网站的列表相关规则,


dedecms如何采集文章 4、

查看采集站点的编码和网站源码

我们右键单击,点击查看源码,在源码的开头位置,找到一个写有charset=某一编码的meta标签,比如charset="gb2312",这个就是第二步中所说的网站编码了

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 5、

新增节点-配置文章网址匹配规则

我们查看采集站点的列表页源码,找到文章列表开始html和结束html标签,分别把它们复制到增加采集节点->文章网址匹配规则的"区域开始的HTML"和“区域结束的HTML”输入框中。你不一定选择右键查看源码来找到文章列表开始标签,你可以在文章开始的地方右键单击,审查元素(chrome浏览器,firefox是查看元素),这样就更方便的找到文章列表开始和结束的标签了。

设置之后我们点击"保存信息并进入下一步设置"

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 6、

网址获取规则测试

如果在测试结果发现有无关的网址信息,说明的第五步中的网址过滤规则有误或者没有填写过滤规则。如果发现采集有误,你可以返回上一次修改,没有就点击“保存信息并进入下一步设置”。


dedecms如何采集文章 7、

内容字段获取规则

我们查看采集站点的文章源码,找到相关选项的开始和结束html标签,填写入指定位置,开始和结束标签以"[内容]"分格。

设置完毕,我们点击"保存配置并预览"

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 8、

过滤规则

在第七步中的匹配规则后面,都 有一个过滤规则,这个过滤规则是用来过滤无需采集的内容。

比如,网易每篇文章都有一个放置广告的iframe标签,我们要采集网易的文章,不可能采集回来之后,一篇一篇得去删除这个广告。但是如何去除呢?去除方法就是那个过滤规则,我们点击常用规则,就会弹出一个小窗口,列出了常用的过滤规则,我们只需点击要们要过滤的规则即可,要过滤网易文章中的iframe标签,我们就点击iframe即可。


dedecms如何采集文章 9、

测试内容字段设置

因为网易有的文章开头是<div id="endText">,有的文章开头是<div id="endText" class="end-text">,所以会出现采集出错的情况。

如果你现在就要采集,你可以点击保存并采集。这里我选择仅保存

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 10、

采集内容(一)

回到采集节点管理的界面,也就是第一步中的界面,我们选择节点,点击采集


dedecms如何采集文章 11、

采集内容(二)


dedecms如何采集文章 12、

查看已下载

可以在采集界面(即第十步中的界面)的右上角,点击“查看已下载”。也可以在“采集节点管理”的界面里点击“查看已下载”。这里以第二个方法为例。

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 13、

导出内容

选择要导入到的栏目,数据量,是否生成html文件 ,随机推荐数量

dedecms如何采集文章_dedecms采集


dedecms如何采集文章 14、

最终结果

  

爱华网本文地址 » http://www.aihuau.com/a/25101010/4099.html

更多阅读

如何将文章当中的全角字符转换成半角字符 日语全角半角转换

如何将文章当中的全角字符转换成半角字符——简介经常打字的朋友可能碰到过这样的情况,不小心将输入法中的半角符号切换到了全角符号,于是打出来的字符都是间距特别大,显得很难看,怎么办?下面小编给大家分享:如何将文章当中的全角字符转换

9SiR火车头采集器教程:1 怎样写采集规则

9SiR火车头采集器教程:[1]怎样写采集规则——简介火车头采集器是一款非常不错的数据采集软件,也是互联网上最流行的采集工具,但是使用相对比较专业,很多火车头采集器新手感到无从下手,今天教新手朋友们如何快速使用火车采集数据。9SiR火

如何让文章首字下沉 word如何首字下沉

有缘相遇,无缘相聚。天涯海角,有緣相遇,無緣相聚。天涯海角,但願相憶。有幸相知,無幸相守。滄海月明,有谋无勇堪指画。有勇无谋易伤生,爱在墙东情在西,心情落地任风吹。我爱你时还再发,情若离心难上爱。如何让文章首字下沉<SPAN><B&g

如何让自己的文章有文采 如何使文章有文采

语言是思想的外壳。文章是语言的艺术。“言之无文,行而不远”孔子对语言的这一精辟论述,强调了语言对文章的重要作用。郭沫若曾把作家的语言比作“雕塑家手里的软泥,画家手里的颜料”。优秀的文章总是伴随着优美的语言。但要使作文的语

声明:《dedecms如何采集文章 dedecms采集规则》为网友天邊彩虹分享!如侵犯到您的合法权益请联系我们删除