蓝天采集器采集百家号 指定关键字

首页 » 采集规则 » 蓝天采集器采集百家号 指定关键字

本站永久发布页

永久回家

简简单单添加一个任务,并设置好请求头信息。

起始网址我们先打开百度,搜索我们的关键字

蓝天采集器采集百家号 指定关键字

蓝天采集器采集百家号 指定关键字

站点内检索填写baijiahao.baidu.com即可,百家号没有独立的搜索功能所以只能用百度站内搜索。

确定后获取到URL:

https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=%E5%8C%97%E4%BA%AC&oq=%E5%8C%97%E4%BA%AC&rsv_pq=f96d29560000f35c&rsv_t=4e91XED25khbYj6MvUBSG5RYpuZaG%2BVBHouTp0jEx%2BMGfyIlYCRD6n3m7Fc&rqlang=cn&rsv_enter=1&rsv_dl=tb&si=baijiahao.baidu.com&ct=2097152

替换关键字规则:

https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=这里是关键字&oq=这里是关键字&rsv_pq=f96d29560000f35c&rsv_t=4e91XED25khbYj6MvUBSG5RYpuZaG%2BVBHouTp0jEx%2BMGfyIlYCRD6n3m7Fc&rqlang=cn&rsv_enter=1&rsv_dl=tb&si=baijiahao.baidu.com&ct=2097152

获取网页xpath语法:

/html/body/div[1]/div[3]/div[1]/div[4]/div/h3[1]/a[1]

我们也可以把蓝天采集切换简单模式,然后分析URL,选择链接区间复制xpath规则。

注:

我们要的规则是同等元素,并非当前元素哦。

本文我们依旧可以xpath匹配,方法如同获取URL链接一样。

我获取到的规则为:

//*[@id="article"]

属性innerhtml,是不是很简单其实只要我们肯做就没有做不到的事情。

原文链接:https://blog.lz.al/148.html

标签:

作者:林哲, 转载或复制请以 超链接形式 并注明出处 ALA林哲
原文地址:《蓝天采集器采集百家号 指定关键字》 发布于2020-08-18

分享到:
赞(0)

评论 抢沙发

3 + 2 =


永久只要一折
永久会员只要一折,一顿早餐钱让你享受这个网络圈福利。
切换注册

登录

忘记密码 ?

切换登录

注册