2020 年 10月随笔档案 - 凌乱的运维

xlwt库模块的使用

摘要：import xlwt wookbook = xlwt.Workbook(encoding="utf-8") #创建workbook对象 worksheet = wookbook.add_sheet('sheet1') #创建工作表 # worksheet.write(0,0,"hello") #向阅读全文

posted @ 2020-10-25 14:45 凌乱的运维阅读(604) 评论(0) 推荐(0)

Re库主要功能函数及可选标志修饰符

摘要：Re库主要功能函数函数说明 re.search() 在一个字符串搜索匹配正则表达式的第一个位置，返回match对象 re.match() 从一个字符串的开始位置起匹配正则表达式，返回match对象 re.findall() 搜索字符串，以列表类型返回全部能匹配的子串 re.split() 将一个阅读全文

posted @ 2020-10-21 22:06 凌乱的运维阅读(331) 评论(0) 推荐(0)

python正则表达式

摘要：python常用正则表达式操作符说明举例 . 表示任何单个字符 [ ] 字符集，对单个字符给出取值范围 [abc]表示a、b、c，[a-z]表示a到z单个字符 [^ ] 非字符集，对单个字符给出排除范围 [^abc]表示非a或b或c的单个字符 * 前一个字符0次或无限次扩展 abc* 表示ab 阅读全文

posted @ 2020-10-21 21:45 凌乱的运维阅读(111) 评论(0) 推荐(0)

bs4

摘要：''' BeautifulSoup4将复杂HTML文档转换成一个复杂的树形结构，每个节点都是Python对象，所有对象可以归纳为4种： - Tag - NavigableString -BeautifulSoup -Comment ''' from bs4 import BeautifulSoup 阅读全文

posted @ 2020-10-21 21:25 凌乱的运维阅读(216) 评论(0) 推荐(0)

urllib

摘要：import urllib.request import urllib.parse # 获取一个get请求 # response = urllib.request.urlopen("http://www.baidu.com") #通过urllib.request库中的urlopen方法打开一个网页，阅读全文

posted @ 2020-10-19 22:44 凌乱的运维阅读(223) 评论(0) 推荐(0)

Python爬虫

摘要：1、任务介绍 https://movie.douban.com/top250 对链接内容包括电影名称、评分、评价数、电影概况、电影链接等需求分析 2、认识爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或脚本。由于互联网数据的多样性和资源的有限性，根据用户需要定向抓取相关网页信息，并分析阅读全文

posted @ 2020-10-09 23:49 凌乱的运维阅读(129) 评论(0) 推荐(0)

10 2020 档案

xlwt库模块的使用

Re库主要功能函数及可选标志修饰符

python正则表达式

bs4

urllib

Python爬虫

导航

公告