BeautifulSoup检索多级标签

  • 对于这样的多级标签

    <li class="l_reply_num" style="margin-left:8px">
    	<span class="red" style="margin-right:3px">4790</span>回复贴,共
    	<span class="red">36</span>页
    </li>, <li class="l_reply_num">
    
  • 要获取第二个span中的内容,可以这样写:

url=urlopen(url)
soup=BeautifulSop(url,'html.parse')//加html.parse代表识别为html语言
total=soup.find_all('li',class_='l_reply_num')//获取到整个li保存到total
res=total[0].contents[2]//获取第一个li标签下的第三个元素,即为:<span class="red">36</span>
result=res.string//获取到第三个span中的36
posted @ 2016-12-19 16:47  呉语伦比  阅读(6103)  评论(0编辑  收藏  举报