摘要:
爬虫 什么是爬虫 通过代码获取网页源码 爬取网页内嵌套的数据 正则题目 a开头由只少一个字母组成的字符串 以1开头,中间3 5位数字,x结尾,中间的值不超过5位 以1开头,中间3 5位数字,x结尾,中间的值不超过5位 re模块的用法 分组命名 (?P正则表达式) 写的时候名字不加引号 ret.gro 阅读全文
posted @ 2020-03-07 23:29
小丁变优秀
阅读(183)
评论(0)
推荐(0)
摘要:
re模块 正则表达式 什么是正则表达式 一套规则,匹配字符串的规则 可以做什么 1. 检测字符串是否合法 表单验证 1. 用户输入,提前检测 2. 提高效率,减轻服务器压力 2. 从一个大文件中找到符合规则的内容 日志分析/爬虫 1. 高效从一大段文字中找到符合规则的内容 正则规则 所有的规则中 阅读全文
posted @ 2020-03-07 16:11
小丁变优秀
阅读(179)
评论(0)
推荐(0)

浙公网安备 33010602011771号