Loading

某课堂接口分析过程

记录下某课堂视频爬取的过程中涉及到的一些接口分析

过程

  1. 首先打开charles进行接口抓取,方便后续分析
  2. 然后在浏览器进行登录,访问课程页面,进入播放页面,进行触发接口
  3. 回到charles进行接口分析
  4. python脚本编写(由于涉及版权问题,不会公开,仅供学习记录)

详细过程

一、接口分析

上面还需要进行charles配置,并进行接口触发等操作(网上教程很多,就不过多赘述)
image

image

https://xxxxxxx/get_terms_detail?cid=xxx&term_id_list=%5Bxxxxx%5D&bkn=xxxxx&t=0.5482
视频的一些详细信息,都在这个接口里,分别需要先获取到cid和term_id,term_id有的直接拼接在url当中,有的需要去课程页面的响应当中拿到

在响应当中,可以拿到每个视频的标题和视频的vid等重要信息,我们拿到这些信息可以进行后续m3u8视频的获取

image

这个接口需要传入term_id和视频的vid才能获取到对应的响应

image
使用上一个获取token的接口拿到的响应当做这个接口的入参,访问可以得到本个视频的详细信息,包括视频的m3u8地址的集合

接下来就是视频的下载了,这些视频全部都是根据AES-128加密的,需要使用对应的m3u8下载工具去下载,还需要有对应的key,这里就需要访问m3u8文件里的uri地址了,然后可以将key下载下来,再根据key解密,才可以下载,但是还有一个问题,就是获取m3u8的时候还需要一个另外的token,这个token也困惑了我很久,找了很久都没有找到返回,最终发现这个token是加密了的,需要解密才能得到。

代码不会上传,自己分析吧,这个就当记录下过程。

posted @ 2021-10-24 22:33  GreenSunIT-绿阳  阅读(50)  评论(0)    收藏  举报