随笔分类 -  爬虫

摘要:loads():将json数据转化成dict数据 dumps():将dict数据转化成json数据 load():读取json文件数据,转成dict数据 dump():将dict数据转化成json数据后写入json文件 阅读全文
posted @ 2020-12-07 18:37 kwz 阅读(63) 评论(0) 推荐(0)
摘要:1、获取当前目录 print(os.getcwd()) print(os.path.abspath(os.path.dirname(__file__))) 2、获取上级目录 print(os.path.abspath(os.path.dirname(os.path.dirname(__file__) 阅读全文
posted @ 2020-08-11 20:05 kwz 阅读(430) 评论(0) 推荐(0)
摘要:conda activate py365 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 要下的包名 退出环境: conda deactivate 阅读全文
posted @ 2020-05-08 14:29 kwz 阅读(708) 评论(0) 推荐(0)
摘要:1.css选择器 (1)标签属性值的提取 1、href的值URL的提取:这是最常见的,我们要进入下一页、或是打开内容页……都少不了URL值,如下面这段HTML,我们来提取一下里面的URL <ol class="page-navigator"> <li class="current"><a href= 阅读全文
posted @ 2020-04-29 10:02 kwz 阅读(829) 评论(0) 推荐(0)