帝国cms自带采集和火车头采集器区别
帝国cms自带采集和火车头采集器哪个更好用?很多新手小白都不知道如何选择。帝国cms自带采集简单方便,小白简单学习即可轻松上手,但是采集功能很少。火车头采集器配置复杂,但是使用复杂,小白不容易入门。下面我的站长站总结一下火车头使用有些优点和缺点,下面大体说一下火车头采集器和帝国cms自带采集功能的区别。
1、软件配置和书写规则的易用性
(1)火车头采集器不是免费的,虽然官网有免费版,但免费版很多功能都不能用,例如发布文章功能不能用,你采集半天,最后发现要发布文章的时候,它提示要收费,呵呵。通过百度查找,网上有火车头7.6破解版可以免费使用,功能和官方的v10版本也差不多,就是界面不一样。下载了火车头并不是马上能用,需要再配置一下对应的帝国cms发布接口,这个发布接口插件从网上能找到,需要配置一下,熟悉一下,还是稍微费点功夫。之后设置采集规则,采集时变量很灵活,这是火车头的优点,不过有些细节需要认真设置,例如图片下载上传的保存路径,这个我就费了点时间。从零到熟练掌握火车头的配置,我大约用了2-3个星期(我比较笨,也没有老师,资料都是自己找到,之后自己反复测试)。
(2)帝国cms自带采集功能,在百度找教程,很简单,用了大约1天时间完全掌握。只要你看得懂html,一般都能很快上手。
总结:火车头采集器的使用、配置有一定的难度,需要费些时间,帝国CMS采集功能是自带的,不需要配置很多,很快上手。
2、采集速度
(1)火车头1-5秒采集1篇文章,按照3秒采集1篇文章。
(2)帝国cms,56分钟采集了8100篇文章(包含了生成文章id的时间),即1秒采集2.4篇。
总结:火车头采集1篇文章3秒,帝国cms3秒钟可以采集7篇左右,也就是说帝国cms采集速度是火车头的7倍左右(个人测试结果,不喜勿喷)。帝国cms的速度优势还是很明显的。
3、发布稳定性
(1)火车头采集文章一般都能成功,但发布的时候有可能会发布失败或发布成功未知等,各种各样的原因,同一条采集规则,有的栏目就能正常发布,但有的栏目就一直提示“发布成功未知”,也就是发布失败,后台没有文章。正常的话,发布文章需要上传图片然后发布文章,大约3秒1篇。
(2)帝国cms能正常采集到的文章,都可以正常入库发布,很稳定。1秒10篇入库速度。
总结:火车头发布文章不稳定,有时候出了问题,很难找到解决办法。帝国cms只要能正常采集到,都可以正常发布。正常发布速度帝国cms大约是火车头的30倍左右(个人测试结果,不喜勿喷)。
4、图片、视频等附件的管理方便性
(1)火车头采集文章图片时,可以设置保存的文件夹,帝国cms也可以设置保存目录,不过火车头设置图片保存文件夹更灵活。火车头采集图片后,在发布文章时,会同步用ftp发布到网站空间。文章能正常使用图片地址。但有个问题,就是发布文章表有数据,但发布文章时是不会去关联帝国CMS附件表的,所以导致我们在编辑已经发布的文章时,在附件管理器中看不到上传的图片,也就不能在文章编辑页面直接删除已经存在图片,需要去空间手动删除。因为文章中的图片没有关联附件表,所以当我们删除后台文章时,对应的图片,也不会自动删除,需要我们去空间手动删除。所以火车头发布文章的附件管理不方便。
(2)帝国cms自带采集功能发布的文章,是按照正常的文章发布流程,所以文章编辑页面的图片管理是正常的。没有问题。
总结:火车头发布文章中带图片、视频等附件,管理不方便,需要去空间手动删除、修改,也不会在删除文章时同步自动删除图片附件。帝国cms自带采集发布的文章图片正常,没问题。
5、特殊字段的采集
(1)火车头在采集特殊字符时很方便,例如帝国cms后台的文章关键词、tag标签、文件名等,这些都可以很灵活的采集到。
(2)帝国cms自带的采集器功能简单,一些字段是不能采集的例如:文章关键词、tag标签、文件名,如果我们需要采集这些默认没有的字段,就需要我们先创建自定义字段,例如自定义字段“文件名”,采集到“文件名”字段后,然后再用sql命令,把自定义字段“文件名”的值,赋值给系统默认的“文件名”字段。步骤复杂些,但也可以实现。
总结
在采集特殊字段方面,火车头有明显的优势,不过帝国cms也可以采集特殊字段,就是步骤麻烦些。
火车头采集器使用很灵活,功能也很多,可以针对不同的网站系统进行采集。但和帝国cms自带采集功能相比,软件易用性、采集速度、发布速度、发布稳定性、图片附件管理方便性等,各种细节上,都是不如帝国自带的采集功能好使的。所以一般情况下,采集文章首选还是推荐帝国cms自带采集功能,特使情况用火车头采集器。
- THINKPHP随风自动采集百度知道问答系统源码v22.5 [2024-07-17]
- wordpress小白网创自动采集发布插件1.3版本修复版 [2024-07-10]
- 帝国cms自带采集和火车头采集器哪个更好用 [2024-04-25]
- [Chrome浏览器插件]anypicker可视化爬虫采集插件 [2024-04-22]
- TTC线报网实时自动采集程序源码,带模板和采集器 [2024-01-16]