Python requests 模块
requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。
安装
pip install requests
使用
requests模块代码编写的流程:
- - 指定url
- - 发起请求
- - 获取响应对象中的数据
- - 持久化存储
-------------案例------------------------- import requests # 指定url url="https://www.sogou.com/" # 发起请求 response = requests.get(url) # 获取响应对象中的数据 page_text = response.text # 持久化存储 with open('./sogou.html','w',encoding='utf-8') as fp: fp.write() -------------------------------------------
参数
# post 数据 response = requests.post(url=url,data=data,headers=headers) # get 数据 response = requests.get(url=url,data=data,headers=headers) # 返回二进制数据 response.content # 返回字符串数据 response.text # 返回json对象 response.json()
其他了解
1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。
# 浏览器抓取 Ajax 请求 F12 --> Network --> XHR --> Name --> Response
2、上面的headers参数是进行UA伪装为了反反爬
反爬机制:UA检测 --> UA伪装
3、下面是http我们爬包是常用的请求头参数
- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型 - Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集 - Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式 - Accept-Language:浏览器通过这个头告诉服务器,他的语言环境 - Host:浏览器同过这个头告诉服务器,想访问哪台主机 - If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间 - Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链 - Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接 - X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问 - User-Agent:请求载体的身份标识
以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注其它相关文章!
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
更新日志
2024年11月18日
2024年11月18日
- 【雨果唱片】中国管弦乐《鹿回头》WAV
- APM亚流新世代《一起冒险》[FLAC/分轨][106.77MB]
- 崔健《飞狗》律冻文化[WAV+CUE][1.1G]
- 罗志祥《舞状元 (Explicit)》[320K/MP3][66.77MB]
- 尤雅.1997-幽雅精粹2CD【南方】【WAV+CUE】
- 张惠妹.2007-STAR(引进版)【EMI百代】【WAV+CUE】
- 群星.2008-LOVE情歌集VOL.8【正东】【WAV+CUE】
- 罗志祥《舞状元 (Explicit)》[FLAC/分轨][360.76MB]
- Tank《我不伟大,至少我能改变我。》[320K/MP3][160.41MB]
- Tank《我不伟大,至少我能改变我。》[FLAC/分轨][236.89MB]
- CD圣经推荐-夏韶声《谙2》SACD-ISO
- 钟镇涛-《百分百钟镇涛》首批限量版SACD-ISO
- 群星《继续微笑致敬许冠杰》[低速原抓WAV+CUE]
- 潘秀琼.2003-国语难忘金曲珍藏集【皇星全音】【WAV+CUE】
- 林东松.1997-2039玫瑰事件【宝丽金】【WAV+CUE】