Python获取动态网页内容的一种处理方法

在使用Python爬取网页数据时,常常会出现网页的源码与实际显示的内容有出入的情况,当网页为动态网页时就会出现这种情况,下面用QQ音乐的某个页面举例如何使用Python爬取改网页数据:

网址:http://y.qq.com/#type=singer&mid=000GDDuQ3sGQiT&tab=album

使用Chrome打开网页,对照网页源码,源码中并无专辑相关内容。

打开开发者工具:

 

对照网页内容,在Sources下面的某个源码里面,发现类似专辑内容的文件,如下图。

右键复制链接地址,使用Python爬取这个链接的内容就可以啦。

posted @ 2015-03-23 12:36  007wangkai  阅读(671)  评论(0)    收藏  举报