02 2018 档案

摘要:不常用的函数总是遗忘,很是困扰啊。于是痛下时间,做一个系统的总结,纯原创,都是些实际项目中常用的函数和方法,当然还有一些这边也是没有记录的,因为我在实际数据处理过程中也没有遇到过(如字符串处理等等)。 创建基本ndarray类实例: 数据类型: 分为三大类:整型,浮点型,python对象。 数组属性 阅读全文
posted @ 2018-02-26 14:02 家迪的家 阅读(603) 评论(0) 推荐(0)
摘要:1.什么是无监督学习? 分类数据没有标签,也叫聚类。k-means 算法是目前最为广泛使用的聚类方法。 在非监督学习中,我们需要将一系列无标签的训练数据,输入到一个算法中,然后我们告诉这个算法,快去为我们找找这个数据的内在结构给定数据。 training set {x1,x2,x3,...} 2.k 阅读全文
posted @ 2018-02-26 11:01 家迪的家 阅读(192) 评论(0) 推荐(0)
摘要:np.random.seed()用法: np.random.choice()的用法: np.random.permutation()的用法: 随机排列一个序列,返回一个排列的序列 np.random.uniform(low=0.0, high=1.0, size=None): 从一个均匀分布[low 阅读全文
posted @ 2018-02-26 09:41 家迪的家 阅读(504) 评论(0) 推荐(0)
摘要:plt.gray():只有黑白两色,没有中间的渐进色 1. 关闭坐标刻度 plt.xticks([]) plt.yticks([]) 关闭坐标轴: plt.axis('off') 注意,类似的这些操作若想起作用,需要将其置于 plt.show() 之前,plt.imshow() 之后。 2. 设置所 阅读全文
posted @ 2018-02-07 09:16 家迪的家 阅读(12494) 评论(0) 推荐(1)
摘要:问题描述 matplotlib绘制图像的时候显示中文时候,中文会变成小方格子。其实matplotlib是支持中文编码的,造成这个现象的原因是,matplotlib库的配置信息里面没有中文字体的相关信息。根据这个思路我们能想到的解决办法就是,修改配置文件。但是不推荐这样。 解决办法 方法一:修改配置文 阅读全文
posted @ 2018-02-06 10:07 家迪的家 阅读(360) 评论(0) 推荐(0)
摘要:对函数与坐标轴之间的区域进行填充,使用fill函数 填充两个函数之间的区域用fill_between 阅读全文
posted @ 2018-02-05 14:04 家迪的家 阅读(1409) 评论(0) 推荐(0)
摘要:读取大文件(内存有限): import pandas as pd reader = pd.read_csv("tap_fun_test.csv", sep=',', iterator=True) loop = True chunkSize = 100000 chunks = [] while loo 阅读全文
posted @ 2018-02-02 14:19 家迪的家 阅读(1783) 评论(0) 推荐(0)
摘要:merge pandas的merge方法提供了一种类似于SQL的内存链接操作,官网文档提到它的性能会比其他开源语言的数据操作(例如R)要高效。 merge的参数 on:列名,join用来对齐的那一列的名字,用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名。 how:数据融合的方法 阅读全文
posted @ 2018-02-02 10:41 家迪的家 阅读(1356) 评论(0) 推荐(0)