会用到的库的
1、selenium的webdriver
2、tesserocr或者pytesseract进行图像识别
3、pillow的Image进行图片处理
from selenium import webdriver import tesserocr from PIL import Image
tesserocr的安装.
获取验证码图片方法1:
def get_code_image(file_name): driver.save_screenshot(file_name) # 截取整个屏幕并保存 code_element = driver.find_element_by_class_name("verify_code_img___1Mei_") # 定位到验证码元素 left = code_element.location['x'] # 定位到截图位置 top = code_element.location['y'] right = code_element.size['width'] + left bottom = code_element.size['height'] + top im = Image.open(file_name) # 从文件读取截图,截取验证码位置再次保存 img = im.crop((left, top, right, bottom)) img.save(file_name) return file_name
获取验证码图片方法2:
def get_code_image(file_name): code_element = driver.find_element_by_class_name("verify_code_img___1Mei_") # 定位到验证码元素 code_element.screenshot(file_name)
注:此方法截图时屏幕会闪动,可能引发bug,如下图,目前没有解决
处理验证码图片
def deal_code_image(file_name): image = Image.open(file_name) # image.show() #查看处理前的图片 # 处理图片去除干扰 # 将图片转化为灰度图像 image = image.convert('L') threshold = 90 # 设置临界值,临界值可调试 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) image = image.point(table, '1') # image.show() #查看处理后的图片 # 1:使用tesseract库识别图片中的验证码 # res = tesserocr.image_to_text(image) # 2:使用pytesseract库识别图片中的验证码 res = pytesseract.image_to_string(image) # print(res) #查看识别出来的文案 res = res.replace(" ", "") #去除结果中的空格 return res
处理前的图片,有干扰,无法识别
处理后的图片,基本可以识别
识别结果不一定准确,如果验证码输入错误,可以点击换一张图片再次识别,多次尝试,本次不做说明
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
更新日志
2024年09月23日
2024年09月23日
- 华少翌.2005-华少翌【中唱艺能】【WAV+CUE】
- 群星《十二女声Ⅱ》[WAV/CUE/分轨][527MB]
- 大自然音乐系列《漫步在山裡》[WAV/CUE/分轨][502.8MB]
- 大自然音乐系列《星光夜语》[WAV/CUE/分轨][453.3MB]
- 史依弘《史依弘交响乐京剧演唱专辑HQ》头版限量编号[WAV+CUE]
- 曼丽2020《女人三十风继续吹》HQCD[WAV+CUE]
- 曼丽2021《女人三十2雾之恋》HQCD[WAV+CUE]
- 隔壁老樊.2019-我曾【好听音乐】【FLAC分轨】
- 高林生.1993-牵挂你的人是我【白天鹅】【WAV+CUE】
- 洪卓立.2012-找个懂我的女孩(国专)【英皇娱乐】【WAV+CUE】
- 曼丽2022《女人三十3晚秋》HQCD[WAV+CUE]
- 曼丽2018《女人三十4冬天》HQCD[WAV+CUE]
- 柏菲-《好歌30年壹》限量开盘母带ORMCD[低速原抓WAV+CUE]
- 大自然音乐系列《水舞》[WAV/CUE/分轨][424.3MB]
- 大自然音乐系列《星光夜语》[WAV/CUE/分轨][453.3MB]