bs4爬虫的一点心得----坑

bs4 里提取a标签里的坑啊

今天遇到了一个很坑的事情

使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性

比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼

我尝试用控制循环的次数和字符串的替换来跳过这个坑。

你懂的

都失败了

最后

我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!

这个bug!!!好坑!!!

posted on 2018-04-14 16:38  猪Ⅷ戒的南宋时代  阅读(321)  评论(0编辑  收藏  举报

导航