文章的采集功能是通过程序来远程获取目标网页内容,经过本地规则解析处理后存储到服务器的数据库内。CmsTop文章采集系统颠覆传统采集模式和流程,采集规则与采集界面分离,规则设置更简单,只需有基础网页设计知识的人员设置好相关规则。编辑人员无需了解太过细节的技术规则,只需选中自己想要采集的文章列表,就可以像发布文章一样,轻松地完成采集操作,提升工作效率,降低人力成本。
1. 高效地采集管理界面
自定义配置的所有采集规则都会在采集管理界面呈现出来,并且能够根据采集更新的频率查找出最新文章,系统通过最新、已查看、已采集标示出文章所处的状态。采集过的文章会在采集列表自动消失,进入已采集列表,不会重复采集。同时还可以根据已设置好的采集规则,通过快速输入网址的方式针对性的采集某篇文章内容(图 5.24‑1)。
图 5.24‑1采集界面
管理人员可以通过采集管理界面预览(图 5.24‑2)将要采集的内容,然后选择性地对需要的文章进行采集,任务添加方便(图 5.24‑3),采集栏目动态化(图 5.24‑4)。
图 5.24‑2文章采集预览
图 5.24‑3编辑监控任务
图 5.24‑4采集栏目动态化
2. 右键转载和修改文章助手
更为方便的是您可以免费使用与CmsTop采集系统配套的“网编工具箱”,它会将网站编辑人员常用的功能包括“转载文章、修改文章、删除本站文章”集成到浏览器前端(错误!未找到引用源。)。这样,使用者在浏览任何网站时如果感觉某篇文章价值很高,即可通过右击鼠标,一键转载到自己的网站,并且转载后方便进行编辑(图 5.24‑6);更为方便的是当您在自己网站前台查看文章,认为某篇文章需要修改时,也可即刻通过右击实现一键文章修改!
图 5.24‑5 本站内容管理
图 5.24‑6一键转载
3. 方便而简洁的采集规则配置
对于需要采集功能的网站来说,简洁而方便的规则配置是易用性的体现。技术人员只需要基本的网页知识就可以随心地去写采集规则(图 5.24‑7)。在写规则的同时,可以实时地显示出采集的内容是否正确。通过此功能可以方便地测试出内容的可用性。另外对一些细节的采集设置也提供了良好的支持,如可以采集分页内容、设置是否远程图片本地化等。
图 5.24‑7采集规则设置
4. 采集规则导入导出
对于已经写好的采集规则,系统会自动添加到规则列表中,以备以后使用。每一规则都可以重复利用,并且可根据需求做出修改。同时,您还可以将自己设置的采集规则导出为XML文件,共享给其他人使用或者导入别人共享的规则(图 5.24‑8)。
图 5.24‑8规则导入