selenium 源码通读·10 |webdriver/common/proxy.py-Proxy 类分析
1 源码路径
复制代码

2 功能说明
使用代理来规避一些反爬虫策略;
3 引入原因
selenium webdriver
测试或进行爬虫时,如果未在目标服务的白名单内,随着爬取的频率增多会被禁止访问目标服务;目标服务的反爬虫策略相对完善的情况下,容易将 selenium 的爬取给禁止;
采用分布式 selenium 爬取方式时,也会很容易的被禁止爬取;
综上,所以 Proxy 类提供了一些反爬虫策略,
4 代理类型
源码:
复制代码
说明:

5 代理类型模式或属性
复制代码

6 各种代理实现
源码:
复制代码
说明:每种代理,都是通过两个方法来实现,先返回代理设置,然后再对代理进行具体的值设置,如下:
复制代码
7 实例说明
复制代码
版权声明: 本文为 InfoQ 作者【虫无涯】的原创文章。
原文链接:【http://xie.infoq.cn/article/b0a9ae5fd14145e4f0811b2dc】。文章转载请联系作者。
评论