大数据时代,爬虫可以提高我们的工作效率,收集信息并分类归纳。在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,所以代理IP是必不可少的,收费代理IP可以使爬虫工作效率更上一层楼,但这也是一笔不小的花费,于是很多人想到了免费代理IP。
网上的免费代理IP有很多,写个小小的爬虫就可以把各大网站上的免费IP收集起来了。接下来就是用这些免费的代理IP来做爬虫了。
当使用免费代理IP时,会发生一下情况:一百个免费代理也许会有一个可以使用,可能一个都没有。好不容易有一个可以用,结果慢的跟蜗牛一样。慢的跟蜗牛一样也就算了,用两下就封IP了,根本爬不动。
爬虫工作本就是为了提高工作效率,结果用了免费代理IP却起了反作用,一点效率都没有,所以还是不要用免费代理IP来做爬虫,只会适得其反。