首先说明一下需要使用的工具以及技术:python3 + selenium
selenium安装方法:pip install selenium
前提:获取自己的qq群成员信息,自己必须是群主或者管理员,然后通过管理页面进入到成员高级管理网页端,就可以对数据进行爬取了!
步骤:
①:首先安装环境 selenium库,selenium是一个自动化库,但是使用它必须用到浏览器驱动,不同的浏览器有不同的驱动,所以需自行下载,我这里是chrome浏览器。
②:运行 程序,然后会需要点击一键登录按钮,点击即可,点击完后,整个页面还未加载全所有的成员信息,所以需要将滚动条下拉至底。
③:等待运行结束,结束后 同目录下就会出现一个xslx文档,里面就是所有的群成员信息
话不多说,上代码就完了!
from selenium import webdriver from time import sleep #1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口 browser = webdriver.Chrome(executable_path ="D:\chromedownload\chromedriver") #2.通过浏览器向服务器发送URL请求 browser.get("https://qun.qq.com/member.html#gid=951192978") sleep(20) #browser.sleep(3) all_number_nickname = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[3]/span[1]') all_number_name = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[4]/span[1]') all_number_order = browser.find_elements_by_class_name('td-no') all_number_qq = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[5]') all_number_sex = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[6]') all_number_qqage = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[7]') all_number_intime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[8]') all_number_marks = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[9]') all_number_lastsaytime = browser.find_elements_by_xpath('//*[@class="list"]/tr/td[10]') # for i in [all_number_qq,all_number_nickname,all_number_name,all_number_order,all_number_sex,all_number_qqage,all_number_intime,all_number_marks,all_number_lastsaytime]: # for j in i: # print(j.text) list=[] for k in range(len(all_number_qq)): list.append([]) list[k].append(all_number_qq[k].text) list[k].append(all_number_nickname[k].text) list[k].append(all_number_name[k].text) list[k].append(all_number_order[k].text) list[k].append(all_number_sex[k].text) list[k].append(all_number_qqage[k].text) list[k].append(all_number_intime[k].text) list[k].append(all_number_marks[k].text) list[k].append(all_number_lastsaytime[k].text) import openpyxl def write_excel_xlsx(path, sheet_name, value): index = len(value) workbook = openpyxl.Workbook() sheet = workbook.active sheet.title = sheet_name for i in range(0, index): for j in range(0, len(value[i])): sheet.cell(row=i+1, column=j+1, value=str(value[i][j])) workbook.save(path) print("xlsx格式表格写入数据成功!") book_name_xlsx = 'python小白交流群成员.xlsx' sheet_name_xlsx = 'python小白交流群成员' value = list write_excel_xlsx(book_name_xlsx, sheet_name_xlsx, value)
总结
以上所述是小编给大家介绍的Python获取统计自己的qq群成员信息的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
华山资源网 Design By www.eoogi.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
华山资源网 Design By www.eoogi.com
暂无评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
2024年11月16日
2024年11月16日
- 群星《抖音嗨疯-DISCO英文版》[WAV+CUE][1G]
- 群星.1990-情义无价(TP版)【中唱】【WAV+CUE】
- 马兆骏.1990-心情·七月【滚石】【WAV+CUE】
- 方伊琪.1979-沙鸥(LP版)【星岛全音】【WAV+CUE】
- 蔡琴《醇厚嗓音》6N纯银SQCD【WAV+CUE】
- 陈曦《遇见HQCD》[WAV+CUE]
- 大提琴-刘欣欣《爱的问候》HDCD[WAV+CUE]
- 周耀辉/邓慧中《从什么时候开始》[320K/MP3][95.71MB]
- 周耀辉/邓慧中《从什么时候开始》[FLAC/分轨][361.29MB]
- 蒋荣宗《蒋荣宗ZONG x FOCA 夏日马戏节》[320K/MP3][89.28MB]
- 坣娜.1997-你怎么可以不爱我【巨石】【WAV+CUE】
- 群星.1992-暗恋桃花源电影原声带【滚石】【WAV+CUE】
- 林隆璇.1989-愤怒的情歌【巨石】【WAV+CUE】
- 勤琴《海上花》[DTS-WAV分轨]
- 群星《歌声有故事》[DTS-WAV分轨]