> 文章列表 > selenium应用之抓取b站黑马视频目录建立学习计划Excel

selenium应用之抓取b站黑马视频目录建立学习计划Excel

selenium应用之抓取b站黑马视频目录建立学习计划Excel

需求故事:
最近时间一下子多了起来,用来学习Java是最合适不过了,但是去b站看视频难免会没有自制力,于是决定用selenium来抓取b站黑马Java视频的目录创建一个学习计划的Excel,便于进行学习进度的管理。
注:纯手打,如有错误欢迎评论区交流!
转载请注明出处:https://blog.csdn.net/testleaf/article/details/130319488
多谢!!!

目录

    • 一、版本说明
    • 二、导入需要使用的库
    • 三、创建并初始化Excel
    • 四、打开网站并窗口最大化
    • 五、获取视频目录列表及其长度
    • 六、遍历视频目录列表内容并存入Excel
    • 七、Excel附加行头
    • 八、保存Excel
    • 九、对生成的Excel进行一些额外的操作
    • 十、后续操作

一、版本说明

Python:3.8.2
selenium应用之抓取b站黑马视频目录建立学习计划Excel
selenium:4.8.2
selenium应用之抓取b站黑马视频目录建立学习计划Excel
openpyxl:3.0.10
selenium应用之抓取b站黑马视频目录建立学习计划Excel
Chrome浏览器版本:112.0.5615.121(正式版本)(64 位)
selenium应用之抓取b站黑马视频目录建立学习计划Excel
chromedriver版本:112.0.5615.49
selenium应用之抓取b站黑马视频目录建立学习计划Excel

二、导入需要使用的库

from selenium import webdriver
from openpyxl import Workbook
from selenium.webdriver.common.by import By

三、创建并初始化Excel

wb = Workbook()
sheet = wb.create_sheet('20天学会Java', 0)

四、打开网站并窗口最大化

driver = webdriver.Chrome()
driver.get('https://www.bilibili.com/video/BV1Cv411372m') ## 打开网站
driver.maximize_window() ## 使浏览器的窗口最大化

五、获取视频目录列表及其长度

videoList = driver.find_elements(By.XPATH,'//ul[@class="list-box"]/li') ## 获取视频目录列表
listLength = len(videoList) ## 获取视频目录列表的长度

selenium应用之抓取b站黑马视频目录建立学习计划Excel

六、遍历视频目录列表内容并存入Excel

for listIndex in range(listLength):print(listIndex+1) ## 打印当前序号,便于知道进度element1 = driver.find_element(By.XPATH,'//ul[@class="list-box"]/li['+str(listIndex+1)+']/a/div/div/span[1]')element2 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div/span[2]')element3 = driver.find_element(By.XPATH, '//ul[@class="list-box"]/li[' + str(listIndex + 1) + ']/a/div/div[2]')element3List = element3.get_attribute('innerText').split(':')if(len(element3List)==2): ## 把时长转化为以秒为单位的形式element3Value = int(element3List[0])*60+int(element3List[1])else:element3Value = int(element3List[0]) * 3600 + int(element3List[1])*60+int(element3List[2])sheet.cell(row=listIndex + 3, column=1, value=element1.get_attribute('innerText'))sheet.cell(row=listIndex + 3, column=2, value=element2.get_attribute('innerText'))sheet.cell(row=listIndex + 3, column=3, value=str(element3.get_attribute('innerText')))sheet.cell(row=listIndex + 3, column=4, value=element3Value)

selenium应用之抓取b站黑马视频目录建立学习计划Excel

七、Excel附加行头

sheet.cell(row=2, column=1, value="序号")
sheet.cell(row=2, column=2, value="标题")
sheet.cell(row=2, column=3, value="时长")
sheet.cell(row=2, column=4, value="时长(秒)")
sheet.cell(row=2, column=5, value="完成情况")
sheet.cell(row=2, column=6, value="完成时间")

八、保存Excel

wb.save(filename=r'b站黑马视频学习进度表.xlsx')

九、对生成的Excel进行一些额外的操作

运行完上述代码,得到一个Excel文件:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

调整单元格使其宽度自适应内容,双击一下这个东西就可以:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

效果如下:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

冻结至第2行:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

在首行第2列插入数据:

="进度:"&ROUND(SUM(E3:E202)/SUM(D3:D202),4)*100&"%;已学:"&ROUND(SUM(E3:E202)/3600,2)&"小时;还剩:"&ROUND((SUM(D3:D202)-SUM(E3:E202))/3600,2)&"小时"

然后回车;

selenium应用之抓取b站黑马视频目录建立学习计划Excel
说明:
1、ROUND(A,2):将A保留两位小数
2、SUM(D3:D202):求D3到D202所有数据的和
3、&:连接字符串

效果:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

十、后续操作

1、看完一集视频就在这里写上与左侧相等的数值:
selenium应用之抓取b站黑马视频目录建立学习计划Excel
第一行进度栏的数值会自动变化:
selenium应用之抓取b站黑马视频目录建立学习计划Excel

2、完成时间这里直接写上:

=NOW()

然后回车,效果:
selenium应用之抓取b站黑马视频目录建立学习计划Excel