摘要:
经常在写完爬虫爬取图片和视频类的二进制文件的时候,发现保存的时候,windows有些特殊字符是保存不了的。写一个函数直接替换成合法的文件名: 1 import re 2 def changeTitle(title): 3 """ 4 正则表达式替换windows文件不能存储的特殊字符 5 """ 6 阅读全文
posted @ 2021-12-13 22:14
、一叶孤城
阅读(832)
评论(0)
推荐(0)
摘要:
今天翻查了下selenium更改User-Agent的文章,大多数都是以下这样的: 1 from selenium import webdriver 2 3 # 定义要将浏览器伪装成的ua 4 ua = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Apple 阅读全文
posted @ 2021-12-13 16:03
、一叶孤城
阅读(3488)
评论(0)
推荐(0)
摘要:
心血来潮,爬取豆瓣电影Top250信息,几个课题记录下: 分两种数据解析方式: 第一为parsel; 第二为将html数据转换成python对象,利用xpath进行解析,对xpath进行复习,用到lxml里的etree。 数据保存方式: 第一为csv; 第二为openpyxl; 第三为pandas; 阅读全文
posted @ 2021-12-13 15:44
、一叶孤城
阅读(330)
评论(0)
推荐(0)

浙公网安备 33010602011771号