摘要: 1.一般来说,为了找到BeautifulSoup对象内任何第一个标签入口,使用find()方法。 以上代码是一个生态金字塔的简单展示,为了找到第一生产者,第一消费者或第二消费者,可以使用Beautiful Soup。 找到第一生产者: 生产者在第一个<url>标签里,因为生产者在整个html文档中第 阅读全文
posted @ 2017-11-20 20:14 做梦当财神 阅读(142041) 评论(1) 推荐(3)
摘要: 如果需要更好的控制输出,而print不能满足需求,sys.stdout,sys.stdin,sys.stderr就是你需要的。 1. sys.stdout与print: 在python中调用print时,事实上调用了sys.stdout.write(obj+'\n') print 将需要的内容打印到 阅读全文
posted @ 2017-11-19 10:10 做梦当财神 阅读(52941) 评论(0) 推荐(2)
摘要: 1. sort()、sorted() (1).sorted()有返回值,sort()没有返回值。 list.sort() (2).另一个不同:list.sort()方法仅被定义在list中,sorted()方法对所有的可迭代序列都有效。 2.key参数/函数 list.sort()和sorted() 阅读全文
posted @ 2017-11-18 14:31 做梦当财神 阅读(485) 评论(0) 推荐(0)
摘要: 1.将列表转换为矩阵的方法:np.array() 2.numpy的属性:ndim, shape, size ndim:空间维数, shape:几行几列, size:元素个数 3.numpy数组的reshape numpy一维数组转高维数组通过reshape实现: 4.type(a)只是数组,要查a中 阅读全文
posted @ 2017-11-16 20:18 做梦当财神 阅读(697) 评论(0) 推荐(0)
摘要: loc:通过行标签索引数据 iloc:通过行号索引行数据 ix:通过行标签或行号索引数据(基于loc和iloc的混合) 使用loc、iloc、ix索引第一行数据: loc: iloc: ix: 阅读全文
posted @ 2017-11-13 10:47 做梦当财神 阅读(24987) 评论(0) 推荐(0)
摘要: 笔记 术语(中英对照): 尺度函数:scaling function(又称父函数 father wavelet) 小波函数:wavelet function(又称母函数 mother wavelet) 连续的小波变换:CWT 离散的小波变换:DWT 小波变换的基本知识: 不同的小波基函数,是由同一个 阅读全文
posted @ 2017-11-09 14:27 做梦当财神 阅读(12623) 评论(0) 推荐(1)
摘要: 描述: filter()函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。 接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,返回True或False,将返回True的元素放到新列表中。 语法: filter(function, iterab 阅读全文
posted @ 2017-11-03 10:36 做梦当财神 阅读(10788) 评论(1) 推荐(0)
摘要: 4.1数据清洗 4.1.1缺失值处理 1.缺失值处理方法:删除记录、数据插补、不处理 2.常用的插补方法: 均值/中位数/众数插补:用该属性取值的平均数/中位数/众数进行插补 使用固定值:将缺失值的属性用一个常量替换。 最近临插补:在记录中找到与缺失值最接近的样本的该属性值插补 回归方法:对带有缺失 阅读全文
posted @ 2017-10-26 17:46 做梦当财神 阅读(2169) 评论(0) 推荐(0)
摘要: 1.创建带有缺失值的数据库: 查看数据内容: 2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。 删除后结果: 阅读全文
posted @ 2017-10-24 11:23 做梦当财神 阅读(37427) 评论(0) 推荐(1)
摘要: 在指定的间隔内返回均匀间隔的数字。(返回num个样本数据,在[start, stop])。 函数形式: linspace(start, stop, num = 50, endpoint = True, retstep = False, dtype = None) start:队列的开始值 stop: 阅读全文
posted @ 2017-10-24 09:22 做梦当财神 阅读(2614) 评论(0) 推荐(0)