当前位置: 首页 > 文档资料 > Pholcus 使用手册 >

采集规则

优质
小牛编辑
136浏览
2023-12-01

3 采集规则

采集规则是Pholcus最重要的组成部分之一,它采用高度灵活的结构化规则实现。



在采集规则里,你可以指定规则名、规则描述、采集网页、采集页数、采集关键词、采集内容字段等。



目前在 https://github.com/pholcus/spider_lib 由所有用户共同维护着一个公共规则库,欢迎大家贡献一份力量!

链接

  • Spider 包讲解
  • Request 结构体
  • Response 结构体
  • 添加一条简单规则
  • 动态字段用法实例
  • 动态Rule用法实例