会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
sakuraxx
每天进步一点点,不要停止前进的脚步~
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
Python数据采集
记录一些使用Python采取页面信息的所用技术知识点和遇见的坑
【Python数据采集】提取页面内容的几种手段
摘要:前言 在我们获取了网页的信息后,往往需要对原始信息进行提取,得到我们想要的数据。对信息的提取方式主要有以下几种:正则表达式、XPath、BeautifulSoup。本篇博客主要总结这三种方式的基本语法,以及举一些例子来说明如何使用这些方法。 正则表达式 什么是正则表达式? 正则表达式是使用某种预定义
阅读全文
posted @
2019-04-14 15:39
sakuraxx
阅读(3043)
评论(0)
推荐(0)
公告