当前位置:首页>帮助中心>雷神HTTP—如何控制爬虫速度?

雷神HTTP—如何控制爬虫速度?

发布日期:2020-10-23 15:35:23 来源:雷神HTTP

     我们在采集数据信息时经常会遇到一些问题而导致爬虫被封,其中采集速度问题如何解决呢?如何控制爬虫速度?

    1、修改是否遵守爬虫协议为False

image.png

      2、修改并发请求数,修改为1,或者2,越小爬取速度越慢,太快容易被识别到

image.png

      3、修改下载延迟时间,DOWNLOAD_DELAY设置越大请求越慢

image.png

      4、开启中间键

image.png

  

       5、开启PIPELINES,一般在要存储数据的时候开启

image.png

  

       6、开启如下设置

image.png

    

       如果爬取页面设置为从page1到page10000,爬取的结果有很多漏掉的。然后将设置修改为如上,还是会有漏掉的。

       解决办法:将DOWNLOAD_DELAY时间设置的更大一些。

       如何突破IP限制问题,建议使用雷神代理,雷神代理拥有上千万的IP池,IP真实稳定可靠。


用户登录

自动登录 忘记密码?

还没帐号?立即注册

用户注册

图形验证码

短信获取

我已阅读并同意 《用户协议》

已有账号?立即登录

忘记密码

图形验证码

短信获取

返回登录