会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
水系cmos日志
网络安全爱好者
博客园
首页
新随笔
联系
管理
订阅
2016年1月20日
Python每日一练(2):找出html中的所有链接(Xpath、正则两个版本)
摘要: 要在hrml文件中找出特定的内容,首先需要观察该内容是什么东西,在什么位置,这样才能找出来。假设html的文件名称是:"1.html"、href属性全都在a标签里。正则版:#coding:utf-8import rewith open('1.html','r') as f: data = f....
阅读全文
posted @ 2016-01-20 11:29 林川的日志
阅读(1852)
评论(0)
推荐(1)
公告