摘要: 转载自:静觅 » Python爬虫入门七之正则表达式 阅读全文
posted @ 2017-03-13 18:04 Mars.wang 阅读(178) 评论(0) 推荐(0)
摘要: 做数据分析的同学大部分入门都是从excel开始的,excel也是微软office系列评价最高的一种工具。 但当数据量超过百万行的时候,excel就无能无力了,python第三方包pandas极大的扩展excel的功能,入门需要花费一点时间,但是真的是做大数据的必备神器! 1.从文件读数据 panda 阅读全文
posted @ 2017-03-13 17:55 Mars.wang 阅读(3518) 评论(0) 推荐(0)
摘要: IO指输入输出,本文主要描述的是python对于文件的操作。 这是写文件,a+指新内容写在目标文件的尾部。 file.read()是读文件,很多时候文件较大,不知道多少行,不能一下子都读进内存,最好是一行一行读。就用到了file.readline() 下面是所有读写文件的模式。 阅读全文
posted @ 2017-03-13 16:53 Mars.wang 阅读(196) 评论(0) 推荐(0)
摘要: mongodb是近一段时间以来比较流行的非关系数据库之一,由于python和它都对json类型有着很好的支持,因此配合起来可谓天衣无缝。 首先要下载python对mongodb支持的包pymongo 上面只是一个简单的查询,也可以再建立连接之后,进行其他的操作,比方插入数据: 或者插入多条数据: 或 阅读全文
posted @ 2017-03-13 16:27 Mars.wang 阅读(3265) 评论(0) 推荐(0)
摘要: mysql是世界上应用最广的免费数据库,python当然也提供了对它的调用。 首先pip install pymysql,当然自己要知道数据库的用户名和密码,本地数据库的host就是localhost. 基本顺序就是 先建立python和数据库的连接,就是像平常我们使用账号和密码登录网站一样,然后建 阅读全文
posted @ 2017-03-13 16:05 Mars.wang 阅读(310) 评论(0) 推荐(0)
摘要: 1.有名字的元组——namedtuple 2.双向链表——deque list访问数据很快,但增删就比较慢,因为list是线性存储,deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈 deque除了实现list的append()和pop()外,还支持appendleft()和popl 阅读全文
posted @ 2017-03-13 10:13 Mars.wang 阅读(292) 评论(0) 推荐(0)
摘要: 输出结果: 也可以用zip同时遍历多个列表,生成一个多维列表 多个list组成字典 列表的合并与拆分 通过列表和字典模拟数据的行列转换 阅读全文
posted @ 2017-03-10 18:30 Mars.wang 阅读(16615) 评论(0) 推荐(1)
摘要: 1.列表和字典的迭代 程序开发中,对列表和字典进行迭代是非常常见的事情。 字典一般可以选择对key进行迭代、对value迭代和对key/value一起迭代 列表的迭代很简单,但如果既要得到列表中元素的值,还想得到对应值的index,可以这么做: for循环里,同时引用了两个变量,在Python里是很 阅读全文
posted @ 2017-03-10 18:10 Mars.wang 阅读(14060) 评论(0) 推荐(0)
摘要: python的函数可以有五种参数:位置参数、默认参数、可变参数、关键字参数和命名关键字参数 1.位置参数 位置参数最简单,函数执行时会按照传入参数的位置进行参数调用,比方在power(5,2)时,函数就明白x=5,n=2,而不是x=2,n=5 2.默认参数 默认参数是在位置参数的基础上,增强的功能, 阅读全文
posted @ 2017-03-10 17:51 Mars.wang 阅读(317) 评论(0) 推荐(0)
摘要: python中有四种最常用的数据结构,分别是列表(list),字典(dict),集合(set)和元组(tuple) 下面简单描述下它们的区别和联系 1.初始化 不得不说,python数据结构的初始化比java是简单的多了。 list=[] dict={} tuple=(1,2,) set=([1,2 阅读全文
posted @ 2017-03-10 17:07 Mars.wang 阅读(277) 评论(0) 推荐(0)