摘要: 先介绍包含的所有规则 接下来看具体使用 阅读全文
posted @ 2017-10-15 10:58 推杯问盏 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 整理了一下之前的 python 笔记,之前都是存在有道云笔记,博客还是方便很多啊。 1、字符串文本能够分成多行。一种方法是使用三引号:"""...""" 或者 '''...'''。行尾换行符会被自动包含到字符串中,但是可以在行尾加上 \ 来避免这个行为。下面的示例: 可以使用反斜杠为行结尾的连续字符 阅读全文
posted @ 2017-10-15 10:08 推杯问盏 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 幂法的原理可参考此篇论文:http://d.wanfangdata.com.cn/Periodical/hnnydxxb2001Z1023 本文求解的是 3 阶矩阵最大特征值及其特征向量 下面是其 C++ 实现代码: 部分参数可修改用于扩展 阅读全文
posted @ 2017-10-11 18:31 推杯问盏 阅读(436) 评论(0) 推荐(0) 编辑
摘要: starts-with 顾名思义,匹配一个属性开始位置的关键字 contains 匹配一个属性值中包含的字符串 text() 匹配的是显示文本信息,此处也可以用来做定位用 eg //input[starts-with(@name,'name1')] 查找name属性中开始位置包含'name1'关键字 阅读全文
posted @ 2017-09-26 15:04 推杯问盏 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 质区别 text()是一个node test,而string()是一个函数,data()是一个函数且可以保留数据类型。此外,还有点号(.)表示当前节点。 使用要点 XML例子: <book><author>Tom John</author></book> 特殊用例 XML例子: text() 经常在 阅读全文
posted @ 2017-09-26 11:31 推杯问盏 阅读(621) 评论(0) 推荐(0) 编辑
摘要: python的os模块 os模块调用CMD命令有两种方式:os.popen(),os.system(). 都是用当前进程来调用。 os.system是无法获取返回值的。当运行结束后接着往下面执行程序。用法如:os.system("ipconfig"). os.popen带返回值的,如何获取返回值。如 阅读全文
posted @ 2017-09-25 15:35 推杯问盏 阅读(610) 评论(0) 推荐(0) 编辑
摘要: 认识selenium 在爬取百度文库的过程中,我们需要使用到一个工具selenium(浏览器自动测试框架),selenium是一个用于web应用程序测试的工具,它可以测试直接运行在浏览器中,就像我们平时用浏览器上网一样,支持IE(7,8,9,10,11),firefox,safari,chrome, 阅读全文
posted @ 2017-09-23 19:59 推杯问盏 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 知乎内容需要登陆后才能查看,与之前案例不同,这里要向浏览器提交登录信息。 首先爬取知乎登录页面 此时出现 500 Server Error,解决方法为通过 headers={...} 更改用户代理为浏览器 在知乎登录页面打开Chrome浏览器F12,这里打钩之后新跳转的页面的信息就不会覆盖之前接受到 阅读全文
posted @ 2017-09-17 19:50 推杯问盏 阅读(329) 评论(0) 推荐(0) 编辑
摘要: Beautiful Soup库基础知识 Beautiful Soup库是解析xml和html的功能库。html、xml大都是一对一对的标签构成,所以Beautiful Soup库是解析、遍历、维护“标签树”的功能库,只要提供的是标签类型Beautiful Soup库都可以进行很好的解析。 Beaut 阅读全文
posted @ 2017-09-16 19:03 推杯问盏 阅读(275) 评论(0) 推荐(0) 编辑
摘要: requests库的7个常用方法 get方法: r = equests.get(url,params=None,**kwargs),r 是服务器返回的一个包含服务器所有资源的Response对象 url :要获取的API/网页的URL链接 params:URL中的额外参数,可以是字典、字节流格式,可 阅读全文
posted @ 2017-09-16 17:09 推杯问盏 阅读(298) 评论(0) 推荐(0) 编辑