python爬取千千音乐

昨天刚写完某狗音乐的爬取，然而我的野心绝不止于在此，所以今天我又搞了某千音乐，某千音乐总体来说是比某狗音乐难一点，有一个加密的签名sign，但是也难逃我的法眼，奥利给

我是按照歌手为分类爬取的，正常思路是 **歌手信息-->歌单信息-->每一首歌的信息-->歌曲的真实播放地址**
但是我今天的思路是不正常的，但是我感觉挺正常的（哈哈哈）我的思路 **歌曲真实播放地址-->每首歌的信息-->歌单信息-->歌手信息**，
其实我这个思路对于音乐网站来说是正确的，也是我爬了这么多（某易云，某q，酷我，酷狗等等）网站得出来的，具体原因看我下面的分析就知道了

1.爬取的音乐

某个歌手的热门单曲

2. 我们来找一些单首歌的真实地址

点击播放全部就会跳到下面这个页面，按照我截图上面的提示操作

复制链接在浏览器中打开

到这里我们就找到歌曲的真实地址了，第一步基本完成
3. 歌曲的地址一般都是别的请求返回来的，我们查找是哪个地址返回的，并查看请求参数
**通过全剧搜索很轻松就能找到**

接下来我们我们看一下请求参数

我们发现有四个参数，分别是sign，appid,TSID,timestamp我们一一分析
sign：经常爬虫的人肯定知道签名认证，一般是js加密的
appid：不会发生改变，是千千音乐的标识 **不用管**
TSID：这还有一个id，仔细想一下这肯定就是歌曲的id了也是需要获取的
timestamp：时间戳
4. 首先破解sign参数
**找到js文件，搜索sign**