斧不止三板

2020年11月23日

python 输出奇数行

摘要: # 输出文件奇数行(从第一行开始) for i in file1: print(i) next(file1) # 跳到文件下一行 注意:next()函数当文件行数为奇数时,会报错 阅读全文

posted @ 2020-11-23 14:17 斧不止三板 阅读(700) 评论(0) 推荐(0) 编辑

2020年8月7日

Python正则表达式search()方法匹配同一串字符时,有时能够匹配到,有时不能匹配到

摘要: search("这里写待匹配的字符串及表达式", file) # file这里是源文件,从这里进行匹配,之前写了个file.read() 文件现读,导致匹配不到(但是第一次试的时候是能匹配到的) 总之,读文件操作不应该放在这个,因为read是需要时间的,不能够保证在匹配操作之前就能读完,尤其是文件比 阅读全文

posted @ 2020-08-07 14:38 斧不止三板 阅读(565) 评论(0) 推荐(0) 编辑

2020年3月1日

Tomcat startup闪退

摘要: cmd 进入tomcat安装文件bin目录内 启动startup.bat 报错JRE_HOME环境不正确 此时本机环境为jdk1.8 tomcat7.0 确定jdk,jre,tomcat环境变量已经配置好了 查找很多资料,都没有解决 最终换tomcat8.0版本 ,没有任何报错 (一般jdk与tom 阅读全文

posted @ 2020-03-01 14:15 斧不止三板 阅读(188) 评论(0) 推荐(0) 编辑

2020年1月21日

python提取url中的所有中文字符

摘要: 以“冠心病”百科首页为例: 复制url后,由于我们没有进行任何处理,此时javascript请求URL并传参数存在中文时,对URL的中文参数进行编码是按照浏览器机制进行编码的,此时编码存在乱码问题。 # -*- coding: UTF-8 -*- import re from urllib.requ 阅读全文

posted @ 2020-01-21 00:37 斧不止三板 阅读(1020) 评论(0) 推荐(0) 编辑

2019年7月23日

python 抓取下拉列表控制的表格的所有数据

摘要: 目标是抓取所有选项下的表格数据。 目标网址:https://gkcx.eol.cn/school/search 用开发者工具查看表格及选项框的构造: 下拉框是<ul><li>标签组成的,用js实现动态切换,靠selenium很难实现定位和模拟点击。 解决方法:分析页面网络请求流,尝试抓取服务器返回给 阅读全文

posted @ 2019-07-23 22:58 斧不止三板 阅读(1925) 评论(0) 推荐(1) 编辑

2019年7月19日

python NoSuchElementException异常处理

摘要: python爬虫程序,用Selenium模拟点击时报出异常NoSuchElementException:Unable to locate...... 出错原因:https://www.cnblogs.com/cttcarrotsgarden/p/11210883.html 异常通常发生于找不到目标元 阅读全文

posted @ 2019-07-19 00:55 斧不止三板 阅读(6542) 评论(0) 推荐(1) 编辑

NoSuchElementException: Message: Unable to locate element:

摘要: python爬虫程序 当用selenium试图找到某个元素时出现报错 原因1:xpath路径不对 解决方法是修改xpath路径 原因2:selenium页面没有加载完全,所以无法锁定到该元素 解决方法是用sleep函数,等待一段时间,使页面能够加载完全 阅读全文

posted @ 2019-07-19 00:27 斧不止三板 阅读(1805) 评论(0) 推荐(0) 编辑

2019年6月25日

连接mysql时遇到的问题

摘要: 1.报错:The server time zone value '???ú±ê×??±??' is unrecognized or represents 解决方法:在jdbc连接的url后面加上serverTimezone=GMT即可 2. WARN: Establishing SSL connec 阅读全文

posted @ 2019-06-25 15:18 斧不止三板 阅读(353) 评论(0) 推荐(0) 编辑

2019年5月30日

eclipse无法启动

摘要: 转自:https://zhidao.baidu.com/question/1959475322658417300.html mmm宥n1安年的回答 eclipse作为Java开发的首选,从官网(www.eclipse.org/downloads/)下载后,直接解压即可使用。如果不能正常启动,通常有以 阅读全文

posted @ 2019-05-30 12:24 斧不止三板 阅读(718) 评论(0) 推荐(0) 编辑

2019年4月25日

python 使用selenium模块实现自动搜索百度百科词条(模拟人工搜索)

摘要: 目标:模拟人工搜索百度百科词条,爬取相关信息,自动删除上一个关键词,输入新关键词,继续搜索,直到循环结束。 代码: 运行结果(部分): 阅读全文

posted @ 2019-04-25 19:49 斧不止三板 阅读(1209) 评论(0) 推荐(0) 编辑

导航