先看看结果吧,去bilibili上拿到的图片=-=
第一步,导入模块
import requests from bs4 import BeautifulSoup
requests用来请求html页面,BeautifulSoup用来解析html
第二步,获取目标html页面
hd = {'user-agent': 'chrome/10'} # 伪装自己是个(chrome)浏览器=-= def download_all_html(): try: url = 'https://www.bilibili.com/' # 将要爬取网站的地址 request = requests.get(url, timeout=30, headers=hd) # 获取改网站的信息 request.raise_for_status() # 判断状态码是否为200,!=200显然爬取失败 request.encoding = request.apparent_encoding # 设置编码格式 return request.text # 返回html页面 except: return ''
第三步,分析网站html构造
1、显示网站html代码
2、找到图片位置
3、分析
第四步,直接上代码注释够详细=-=
def parse_single_html(html): soup = BeautifulSoup(html, 'html.parser') # 解析html,可以单独去了解一下他的使用 divs = soup.find_all('div', class_='card-pic') # 获取满足条件的div,find_all(所有) for div in divs: # 瞒住条件的div有多个,我们单独获取 p = div.find('p') # 有源代码可知,每个div下都有一个p标签,存储图片的title,获取p标签 if p == None: continue title = p['title'] # 获取p标签中的title属性,用来做图片的名称 img = div.find('img')['src'] # 获取图片的地址 if img[0:6] != 'https:': # 根据源代码发现,有的地址缺少"https:"前缀 img = 'https:' + img # 如果缺少,我们给他添上就行啦,都据情况而定 response = requests.get(img) # get方法得到图片地址(有的是post、put)基本是get with open('./Img/{}.png'.format(title), 'wb') as f: # 创建用来保存图片的.png文件 f.write(response.content) # 注意,'wb'中的b 必不可少!! parse_single_html(download_all_html()) # 最后调用我们写的两个函数就行啦,
查看结果
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
2024年11月19日
2024年11月19日
- 好薇2024《兵哥哥》1:124K黄金母盘[WAV+CUE]
- 胡歌.2006-珍惜(EP)【步升大风】【FLAC分轨】
- 洪荣宏.2014-拼乎自己看【华特】【WAV+CUE】
- 伊能静.1999-从脆弱到勇敢1987-1996精选2CD【华纳】【WAV+CUE】
- 刘亮鹭《汽车DJ玩主》[WAV+CUE][1.1G]
- 张杰《最接近天堂的地方》天娱传媒[WAV+CUE][1.1G]
- 群星《2022年度发烧天碟》无损黑胶碟 2CD[WAV+CUE][1.4G]
- 罗文1983-罗文甄妮-射雕英雄传(纯银AMCD)[WAV+CUE]
- 群星《亚洲故事香港纯弦》雨果UPMAGCD2024[低速原抓WAV+CUE]
- 群星《经典咏流传》限量1:1母盘直刻[低速原抓WAV+CUE]
- 庾澄庆1993《老实情歌》福茂唱片[WAV+CUE][1G]
- 许巍《在别处》美卡首版[WAV+CUE][1G]
- 林子祥《单手拍掌》华纳香港版[WAV+CUE][1G]
- 郑秀文.1997-我们的主题曲【华纳】【WAV+CUE】
- 群星.2001-生命因爱动听电影原创音乐AVCD【MEDIA】【WAV+CUE】