蜂集采集器新功能介绍

发布功能

发布模块现在不仅支持发布到本地Wordpress,还支持保存为sqlite数据库。如下图:

图片[1]-蜂集采集器新功能介绍-栗子博客

采集规则

现在采集列表页不仅支持通配符,还支持使用jquery选择器(css选择器)来提取网页中的链接。如下图:

图片[2]-蜂集采集器新功能介绍-栗子博客

现在提取链接的方式更加多样,大家可以选择自己熟悉的方式去写规则。

内容替换现支持正则表达式和jquery选择器进行替换。方便替换文中的广告等一大块内容。如下图,可选的有正则和JQuery表达式

图片[3]-蜂集采集器新功能介绍-栗子博客

内容加工现在支持去除文字链和a标签的链接,如下图:

图片[4]-蜂集采集器新功能介绍-栗子博客

当前采集器功能一览

采集特色
  1. 直接在wordpress中运行,无需额外环境
  2. 全自动无人值守,多任务自动调度运行
  3. 可设置同步源站点更新
  4. AI关键词、摘要自动生成
  5. 正文支持采集分页
发布特色
  1. 免接口发布到本地wordpress
  2. 远程图片自动下载到本地
  3. 支持自定义文章类型
  4. 支持自定义分类法
  5. 支持自定义字段发布
  6. 支持多字段拼接成一个字段发布
  7. 支持发布为一个SQLite数据库
正文抓取规则
  1.  正则表达式
  2. XPath表达式
  3. JQuery选择器(css选择器)
  4. 固定字符串
列表提取规则
  1. 通配符提取链接
  2. JQuery选择器提取链接
  3. XPath范围自动提取链接
  4. 正则范围自动提取链接
  5. 无限级列表提取

 

内容加工
  1. 内置多种内容加工规则,直接勾选即可使用
代理支持
  1.  支持HTTP代理
  2. 支持SOCKS5代理
其他功能
  1. 支持设置Cookie
© 版权声明
THE END
点赞0
抢沙发
头像
提交
头像

昵称

取消
昵称
一言一语