随笔分类 -  Python数据采集

记录一些使用Python采取页面信息的所用技术知识点和遇见的坑
摘要:前言 在我们获取了网页的信息后,往往需要对原始信息进行提取,得到我们想要的数据。对信息的提取方式主要有以下几种:正则表达式、XPath、BeautifulSoup。本篇博客主要总结这三种方式的基本语法,以及举一些例子来说明如何使用这些方法。 正则表达式 什么是正则表达式? 正则表达式是使用某种预定义 阅读全文
posted @ 2019-04-14 15:39 sakuraxx 阅读(3043) 评论(0) 推荐(0)