爬虫 requests 模块 入门到入狱 :基础知识 + 实战分析
📢📢📢📣📣📣🌻🌻🌻Hello,大家好我叫是 Dream 呀,一个有趣的 Python 博主,小白一枚,多多关照😜😜😜🏅🏅🏅CSDN Python 领域新星创作者,大二在读,欢迎大家找我合作学习💕
入门须知:这片乐园从不缺乏天才,努力才是你的最终入场券!🚀🚀🚀
💓最后,愿我们都能在看不到的地方闪闪发光,一起加油进步🍺🍺🍺
🍉🍉🍉“一万次悲伤,依然会有 Dream,我一直在最温暖的地方等你”,唱的就是我!哈哈哈~🌈🌈🌈🌟🌟🌟✨✨✨
前言:
requests 库其实和 urllib 库是差不多的,但是 urllib 库的话有点过时了,所以说一般都是用的 request 库,下面一起来学习一下吧
@TOC
一、基本使用
1.使用文档
官方文档http://cn.python‐requests.org/zh_CN/latest/
快速上手http://cn.python‐requests.org/zh_CN/latest/user/quickstart.html
2.安装
安装成功后会有 successfully 的提示,已安装会有 Requirement already satisfied 的提示:
3.response 的属性以及类型
1.类型
2.以字符串形式来返回网页的源码
3.返回一个 url 地址
4.返回的是二进制数据
5.返回响应的状态码
6.返回的是响应头
二、简单对比 urllib 和 requests
1.urllib
2.requests
三、requests 方法应用
1.requests 的 get 请求
(1)请求百度界面
(2)特点总结
1.参数使用 params 传递 2.参数无需 urlencode 编码 3.无需请求对象定制 4.请求资源路径中的?可以加也可以不加
2.requests 的 post 请求
(1)请求百度翻译
(2)特点总结
1.post 请求不需要编解码 2.post 请求的参数是 data3.不需要请求对象的定制
3.requests 的 cookie 代理
(1)登录古诗文网
1.打开古诗文网:古诗文网
2.登录界面:
3.获取页面的源码
4.解析页面源码,然后获取'__VIEWSTATE'和'__VIEWSTATEGENERATOR'
5.获取验证码图片
6.获取图片验证码后,保存到本地,然后观察验证码进行输入。
7.点击登录
8.获取动态验证码
9.打开得到的网站:
进入:
成功撒花!
(2)难点
1.隐藏域 2.验证码
四、自动识别验证码
1.首先找到超级鹰
网站:
可用账号及密码: 账号:action 密码:action
2.然后在开发文档中找到 Python:
进入之后进行 Python 语言 Demo 下载。
3.修改代码
将下载好的 Demo 放入我们我们的工程文件中去,观察其代码:1.将此处换成我们的用户名和代码
2.按照提示来替换我们的 id:
3.生成我们自己的一个软件 id:
4.最后在 print 后面加上(),就可以啦!5.由于返回字典,就可以通过键值对对应关系,找到我们的验证码的值了:
4.源码分享:
🌲🌲🌲 好啦,这就是今天要分享给大家的全部内容了❤️❤️❤️如果你喜欢的话,就不要吝惜你的一键三连了~
评论