python之路--爬虫第三篇
本来打算写Scrapy的相关笔记,,,,,,,,,,,,,,,,但是,我的水平有限,听着课程脑子很懵,索性,,,,写一写直播课程的内容吧。 也希望老师见谅。
第二三节直播课中,主要分享了爬去抖音小姐姐视频的故事。/手动滑稽 咳咳。。进入正题
惯例,先分享一下项目实现思路:
1.要爬去用户的用户ID,不是抖音ID哦。
2.根据抖音ID拼接字符串:https://www.douyin.com/share/user/{用户ID}
3.获取用户数据:https://www.douyin.com/aweme/v1/aweme/post/?user_id={0}&count=21&max_cursor=0&aid=1128&_signature={签名信息}
/其他信息在首次访问2.的连接的时候可以获取到相关数据
4.根据返回的用户数据就能拿到视频的地址信息,然后就可以进行播放下载了
这里有两个点需要额外注意:
1.这个签名信息需要用到JS模块,关于这个JS模块我就很费解了,只知道可以用逆向思维,找到真正定义并调用_signature的地方,然后找到在本地获取签名信息的方法。这里我能力有限,写不出很高深的东西出来。……
2.获取到的视频地址信息需要用到原旧接口才可以直接下载。
-----------------------------------------------------------------------------------------------------------------
人生刚刚开始,学习仍要继续! 不忘初心,方得始终。
我已经开始了我的进京之路! --Mobs
浙公网安备 33010602011771号