代码改变世界

随笔分类 -  Beautiful Soup

python3 - 通过BeautifulSoup 4抓取百度百科人物相关链接

2017-02-14 15:42 by 菜鸟Alex, 1082 阅读, 收藏,
摘要: 导入需要的模块 需要安装BeautifulSoup 要抓取的内容里面的链接如图 打开网页审查查看标签如图: 可以看出内容属于标签 以及 的属性是 则: 如果有异常则打印 异常内容 首先查找标签 再查找 标签下的子标签 ,标签 的属性 用正则表达式匹配筛选,因为其下面的链接是以 或者 开头的 判断如果 阅读全文