摘要:import xlwt wookbook = xlwt.Workbook(encoding="utf-8") #创建workbook对象 worksheet = wookbook.add_sheet('sheet1') #创建工作表 # worksheet.write(0,0,"hello") #向
阅读全文
摘要:Re库主要功能函数 函数 说明 re.search() 在一个字符串搜索匹配正则表达式的第一个位置,返回match对象 re.match() 从一个字符串的开始位置起匹配正则表达式,返回match对象 re.findall() 搜索字符串,以列表类型返回全部能匹配的子串 re.split() 将一个
阅读全文
摘要:python常用正则表达式 操作符 说明 举例 . 表示任何单个字符 [ ] 字符集,对单个字符给出取值范围 [abc]表示a、b、c,[a-z]表示a到z单个字符 [^ ] 非字符集,对单个字符给出排除范围 [^abc]表示非a或b或c的单个字符 * 前一个字符0次或无限次扩展 abc* 表示ab
阅读全文
摘要:''' BeautifulSoup4将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: - Tag - NavigableString -BeautifulSoup -Comment ''' from bs4 import BeautifulSoup
阅读全文
摘要:import urllib.request import urllib.parse # 获取一个get请求 # response = urllib.request.urlopen("http://www.baidu.com") #通过urllib.request库中的urlopen方法打开一个网页,
阅读全文
摘要:1、任务介绍 https://movie.douban.com/top250 对链接内容包括电影名称、评分、评价数、电影概况、电影链接等需求分析 2、认识爬虫 网络爬虫,是一种按照一定规则,自动抓取互联网信息的程序或脚本。由于互联网数据的多样性和资源的有限性,根据用户需要定向抓取相关网页信息,并分析
阅读全文