关于 web 自动化过程中滑块解锁问题以及页面滚动的问题的研究
滑块解锁
该问题主要源于各个平台的登录验证或者针对爬虫或selenium
的一种防范手段。由于各个网站的防爬技术的提高,常规selenium
似乎无法通过滑块验证,以下提供普遍的滑块验证思路,以供参考:
获取滑块本身的元素以及滑块所在长条的元素
根据滑块元素的
size
和所在矩形元素的size
便能得到滑块的偏移量使用
selenium
库中的actionChains
中的click_and_hole
和move_by_offset
来控制滑块行动
复制代码
然后通过对滑动轨迹:即一定时间内滑动的偏移量的变化,来模拟真人操作,试图通过检测
复制代码
结论
遗憾的是,有些网站的滑块检测条件极为苛刻又难以捉摸,即使使用了随机暂停,加速度变化等操作来模拟真人滑动,还是无法通过检测。疑似要通过人工智能的方式来解决。
浏览器页面滚动
使用 JS 进行滚动
因为一般滚动条都不作为单独的元件出现,而是附庸在某个div
或table
上,当这些元件展示内容过多时便会自动出现滚动条,所以难以通过selenium
定位然后actionChains
调用方法进行拖拽的方式控制页面滚动,需要通过JS
来完成对滚动条的操作。
常见 JS
针对整个页面进行滚动
复制代码
针对单个元素的内嵌滚动条进行滚动
复制代码
评论