摘要: .net中的XPATH是1.0版本的,很多2.0中的函数是不兼容的,比如lower-case()、replace()函数等,下面中的XPATH语句在运行时会报错 //table[contains(lower-case(normalize-space(string()),'investment obj 阅读全文
posted @ 2019-06-17 10:18 微时空 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 可以使用string.GetEnumerator()返回字符串的CharEnumerator对象,然后遍历该对象一个个字符进行正则判断。 阅读全文
posted @ 2019-06-17 00:37 微时空 阅读(1977) 评论(0) 推荐(0) 编辑
摘要: 在上面的Html表格中,我们要抓出每个tr标签中第2个td的文本内容,一开始想到的XPATH语句是这么写的: //td[contains(text(),':') and contains(text(),'(') and contains(text(),')') and (contains(text( 阅读全文
posted @ 2019-06-14 14:59 微时空 阅读(3002) 评论(0) 推荐(0) 编辑
摘要: 工作中很多时候经常需要网抓数据或者把数据填写到网站上,使用Selenium将其自动化是一种不错的选择。Selenium其实是一个用于Web应用程序测试的工具,测试你的应用程序看是否能够很好地工作在不同浏览器和操作系统之上。它可直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 阅读全文
posted @ 2019-06-04 11:26 微时空 阅读(7567) 评论(0) 推荐(1) 编辑
摘要: 读TXT: 写TXT: 阅读全文
posted @ 2019-06-04 10:42 微时空 阅读(5063) 评论(0) 推荐(0) 编辑
摘要: Q-dir,可以分界面,分文件夹,快捷选择等优势,非常好用的工具,可以替代微软的File Explorer。 官网:https://www.softwareok.com/?seite=Freeware/Q-Dir 阅读全文
posted @ 2019-06-04 10:13 微时空 阅读(734) 评论(0) 推荐(0) 编辑
摘要: HtmlAgilityPack真是一把网抓利器,可以迅速地从网页抓到想要的文本或数据,使用起来十分方便,引用时在NuGet安装添加并在头部引用using HtmlAgilityPack;即可。 针对网址直接使用Load方法: 如果需要读取的html文档是本地的,可以先获取数据流,再使用LoadHtm 阅读全文
posted @ 2019-06-03 19:50 微时空 阅读(1442) 评论(0) 推荐(0) 编辑
摘要: 以上代码在使用pyodbc连接sql数据库时,在开发机器上运行是ok的,但到了其他电脑就运行出错,报错信息如下: pyodbc.InterfaceError: ('IM002', '[IM002] [Microsoft][ODBC Driver Manager] Data source name n 阅读全文
posted @ 2019-06-03 18:16 微时空 阅读(3839) 评论(0) 推荐(0) 编辑
摘要: C#中,如果碰到需要调用Python代码时,一种方法是使用IronPython,不过这种方法太繁琐太累,特别是碰到Python代码中带有大量的第三方包,就会一直报错,提示缺少相应模块,这种方法太low,只支持Python2代码,果断摒弃。推荐另一种方法是用pyinstaller打包Python程序, 阅读全文
posted @ 2019-05-30 17:50 微时空 阅读(10463) 评论(0) 推荐(0) 编辑
摘要: 淘宝上新买了一个内置光驱来读光盘,本来应该买外置的买错了买了内置,不过也是可以用的,只不过每次使用需要拆开主机连线,比较麻烦,幸好用的次数不多,就将就不再买外置的了。第一次使用的时候会听到光驱里面有很大的噪音,过一阵没有过一阵又有,总之噪音有规律地出现,声音尖锐像老鼠叫,把光盘按出来后看了看又放回去 阅读全文
posted @ 2019-05-24 00:26 微时空 阅读(392) 评论(0) 推荐(0) 编辑