Python爬虫知识点(bs/find_all/正则表达式)
网站选择

格式输出

BeautifulSoup库

- 
tag.string返回的是标签内的字符串内容,如果标签内只有一个字符串,那么tag.string就会返回这个字符串;如果标签内还包含其他标签,那么tag.string就可能返回 None。
- 
tag.text返回的是标签内所有字符串内容的拼接,包括子标签内的字符串内容。它会把标签内的所有字符串连接起来作为一个字符串返回。



信息提取


正则表达式


 
 


网站选择

格式输出

BeautifulSoup库

tag.string 返回的是标签内的字符串内容,如果标签内只有一个字符串,那么 tag.string 就会返回这个字符串;如果标签内还包含其他标签,那么 tag.string 就可能返回 None。
tag.text 返回的是标签内所有字符串内容的拼接,包括子标签内的字符串内容。它会把标签内的所有字符串连接起来作为一个字符串返回。



信息提取


正则表达式


 
 


