10 2020 档案

xlwt库模块的使用
摘要:import xlwt wookbook = xlwt.Workbook(encoding="utf-8") #创建workbook对象 worksheet = wookbook.add_sheet('sheet1') #创建工作表 # worksheet.write(0,0,"hello") #向 阅读全文

posted @ 2020-10-25 14:45 凌乱的运维 阅读(604) 评论(0) 推荐(0)

Re库主要功能函数及可选标志修饰符
摘要:Re库主要功能函数 函数 说明 re.search() 在一个字符串搜索匹配正则表达式的第一个位置,返回match对象 re.match() 从一个字符串的开始位置起匹配正则表达式,返回match对象 re.findall() 搜索字符串,以列表类型返回全部能匹配的子串 re.split() 将一个 阅读全文

posted @ 2020-10-21 22:06 凌乱的运维 阅读(331) 评论(0) 推荐(0)

python正则表达式
摘要:python常用正则表达式 操作符 说明 举例 . 表示任何单个字符 [ ] 字符集,对单个字符给出取值范围 [abc]表示a、b、c,[a-z]表示a到z单个字符 [^ ] 非字符集,对单个字符给出排除范围 [^abc]表示非a或b或c的单个字符 * 前一个字符0次或无限次扩展 abc* 表示ab 阅读全文

posted @ 2020-10-21 21:45 凌乱的运维 阅读(111) 评论(0) 推荐(0)

bs4
摘要:''' BeautifulSoup4将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: - Tag - NavigableString -BeautifulSoup -Comment ''' from bs4 import BeautifulSoup 阅读全文

posted @ 2020-10-21 21:25 凌乱的运维 阅读(216) 评论(0) 推荐(0)

urllib
摘要:import urllib.request import urllib.parse # 获取一个get请求 # response = urllib.request.urlopen("http://www.baidu.com") #通过urllib.request库中的urlopen方法打开一个网页, 阅读全文

posted @ 2020-10-19 22:44 凌乱的运维 阅读(223) 评论(0) 推荐(0)

Python爬虫
摘要:1、任务介绍 https://movie.douban.com/top250 对链接内容包括电影名称、评分、评价数、电影概况、电影链接等需求分析 2、认识爬虫 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本。由于互联网数据的多样性和资源的有限性,根据用户需要定向抓取相关网页信息,并分析 阅读全文

posted @ 2020-10-09 23:49 凌乱的运维 阅读(129) 评论(0) 推荐(0)

导航