摘要: (一) 三种网页抓取方法 1、 正则表达式: 模块使用C语言编写,速度快,但是很脆弱,可能网页更新后就不能用了。 2、 Beautiful Soup 模块使用Python编写,速度慢。 安装: pip install beautifulsoup4 3、 Lxml 模块使用C语言编写,即快速又健壮,通 阅读全文
posted @ 2018-04-09 10:19 free赖权华 阅读(2110) 评论(0) 推荐(1)