08 2019 档案

摘要:value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用 阅读全文
posted @ 2019-08-15 20:57 地球上最后一个直男 阅读(2609) 评论(0) 推荐(0)
摘要:concatenate() 我们先来介绍最全能的concatenate()函数,后面的几个函数其实都可以用concatenate()函数来进行等价操作。 concatenate()函数根据指定的维度,对一个元组、列表中的list或者ndarray进行连接,函数原型: numpy.concatenat 阅读全文
posted @ 2019-08-15 16:33 地球上最后一个直男 阅读(16510) 评论(0) 推荐(0)
摘要:作者:忆臻链接:https://www.zhihu.com/question/22178202/answer/161732605来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 作者:忆臻链接:https://www.zhihu.com/question/2217820 阅读全文
posted @ 2019-08-10 09:43 地球上最后一个直男 阅读(12021) 评论(0) 推荐(2)
摘要:demo1 这说明1与True,0与False在python来说是完全相等的东西。 demo2 在demo2中可以看出二者之间关系的妙用。x%2=0 <——> x%2 = True 版权声明:本文为CSDN博主「Bruce chen」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出 阅读全文
posted @ 2019-08-09 10:46 地球上最后一个直男 阅读(11102) 评论(0) 推荐(0)
摘要:转载至:https://blog.csdn.net/m0_38061927/article/details/77198990 1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型作出的分类判断两个标准进行汇总。这个名字来源于它可以非常 阅读全文
posted @ 2019-08-09 10:43 地球上最后一个直男 阅读(1512) 评论(0) 推荐(0)
摘要:转载至:https://www.cnblogs.com/haiyan123/p/9804091.html 1、介绍itertools 是python的迭代器模块,itertools提供的工具相当高效且节省内存。使用这些工具,你将能够创建自己定制的迭代器用于高效率的循环。- 无限迭代器 itertoo 阅读全文
posted @ 2019-08-07 22:59 地球上最后一个直男 阅读(522) 评论(0) 推荐(0)
摘要:这个错误真的tmd伤脑筋。我用idxmax函数去求series类型的最大值的索引,结果明明是下面这种数据, 无论我如何pint他的shape,type,他怎么看都是一个满足idxmax函数要求的参数类型:标准的Series类型,且每个元素都是浮点数, 但是: 然鹅,当我最后在调试中看到了一个不起眼的 阅读全文
posted @ 2019-08-07 15:15 地球上最后一个直男 阅读(3501) 评论(1) 推荐(0)
摘要:转载至:https://www.cnblogs.com/liulangmao/p/9211537.html pandas Series 的 argmax 方法和 idxmax 方法用于获取 Series 的最大值的索引值: 举个栗子: 有一个pandas Series,它的索引是国家名,数据是就业率 阅读全文
posted @ 2019-08-07 11:57 地球上最后一个直男 阅读(1686) 评论(0) 推荐(0)
摘要:DataFram类型的变量a,设a有n个样本,m个特征,当执行语句b = a.values后,b为(n, m)的ndarray矩阵类型,当执行c = b.ravel()后,c为(n*m,)维行向量 阅读全文
posted @ 2019-08-06 09:05 地球上最后一个直男 阅读(675) 评论(0) 推荐(0)
摘要:交叉验证的原理放在后面,先看函数。 设X是一个9*3的矩阵,即9个样本,3个特征,y是一个9维列向量,即9个标签。现在我要进行3折交叉验证。 执行kFold = KFold(n_splits=3) :其中KFold是一个类,n_split=3表示,当执行KFold的split函数后,数据集被分成三份 阅读全文
posted @ 2019-08-05 21:10 地球上最后一个直男 阅读(21515) 评论(0) 推荐(6)
摘要:可以通过.columns和.index着两个属性返回数据集的列索引和行索引 设data是pandas的一个DataFram类型的数据集。 则data.index返回一个index类型的行索引列表,data.index.values返回的是行索引组成的ndarray类型。 则data.columns返 阅读全文
posted @ 2019-08-05 10:58 地球上最后一个直男 阅读(29633) 评论(0) 推荐(0)
摘要:运行结果 阅读全文
posted @ 2019-08-04 23:18 地球上最后一个直男 阅读(377) 评论(0) 推荐(0)
摘要:转载至:https://blog.csdn.net/w_weiying/article/details/81411257 loc函数:通过行索引 "Index" 中的具体值来取行数据(如取"Index"为"A"的行) iloc函数:通过行号来取行数据(如取第二行的数据) 本文给出loc、iloc常见 阅读全文
posted @ 2019-08-04 18:44 地球上最后一个直男 阅读(6370) 评论(0) 推荐(2)
摘要:原文链接:https://blog.csdn.net/weixin_39175124/article/details/79463993 数据在前处理的时候,经常会涉及到数据标准化。将现有的数据通过某种关系,映射到某一空间内。常用的标准化方式是,减去平均值,然后通过标准差映射到均至为0的空间内。系统会 阅读全文
posted @ 2019-08-04 18:18 地球上最后一个直男 阅读(4518) 评论(0) 推荐(1)
摘要:原文链接:https://www.jianshu.com/p/f0ed06cd5003 import pandas as pd df = pd.DataFrame(……) 说明:以下“df”为DataFrame对象。 1. df. sort_values() 作用:既可以根据列数据,也可根据行数据排 阅读全文
posted @ 2019-08-04 11:33 地球上最后一个直男 阅读(24219) 评论(0) 推荐(1)
摘要:原文链接:https://www.jianshu.com/p/f773b4b82c66 value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对 阅读全文
posted @ 2019-08-04 11:27 地球上最后一个直男 阅读(12888) 评论(0) 推荐(1)
摘要:原文链接:https://blog.csdn.net/xtingjie/article/details/72510834 numpy中包含的newaxis可以给原数组增加一个维度 np.newaxis放的位置不同,产生的新数组也不同 一维数组 由以上代码可以看出,当把newaxis放在前面的时候 以 阅读全文
posted @ 2019-08-03 23:58 地球上最后一个直男 阅读(3553) 评论(0) 推荐(0)
摘要:设a是ndarray的矩阵,如果我要获得该矩阵的第k列并且以列向量的形式得到结果,那么我的第二维索引不能是一个数值,而应是一个范围。 例如如下代码获取3*3矩阵中的第二列 运行结果如下 阅读全文
posted @ 2019-08-03 22:30 地球上最后一个直男 阅读(243) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/yanwucao/article/details/80211984 DataFrame.insert(loc, column, value, allow_duplicates=False) Insert column into DataFrame 阅读全文
posted @ 2019-08-03 21:36 地球上最后一个直男 阅读(3953) 评论(0) 推荐(0)
摘要:zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。 如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。在python3中,zip函数返回一个迭代器。 如果zip函数中的参数前面有一个* 阅读全文
posted @ 2019-08-03 15:08 地球上最后一个直男 阅读(806) 评论(0) 推荐(0)
摘要:函数签名:def norm(x, ord=None, axis=None, keepdims=False) 其中ord参数表示求什么类型的范数,具体参见下表 下面是用代码对一个列表求上面的范数 运行结果如下 其中的axis=0表示对矩阵的每一列求范数,axis=1表示对矩阵的每一行求范数, keep 阅读全文
posted @ 2019-08-03 14:49 地球上最后一个直男 阅读(9061) 评论(0) 推荐(0)
摘要:函数map(func, value)中,func是一个函数名,value是要传给func的参数值,最后返回一个迭代器,如果要将这个迭代器以列表形式显示出来,接得用list函数。 如下代码就是对输入的列表每个值求立方 运行结果如下 map函数还可以用于类型转换,可以将一个数字组成的字符串或者元素是字符 阅读全文
posted @ 2019-08-03 14:21 地球上最后一个直男 阅读(393) 评论(0) 推荐(0)
摘要:在python中,这两个是python中的可变参数,*arg表示任意多个无名参数,类型为tuple;**kwargs表示关键字参数,为dict。 例如下面这个代码可以利用*args计算传入的n个数的平方和,n是可变的 运行结果是输出30. 下面的代码是参数**kwargs的用法 运行结果为 阅读全文
posted @ 2019-08-03 11:32 地球上最后一个直男 阅读(276) 评论(0) 推荐(0)
摘要:1.a = b是将b的id复制给b,然后a与b指向同一个对象 可以通过下图的运行结果看到,a的id与b的id相等,指向的同一个物体。 2. b = a.view() 是浅复制,b和a是不同的对象,但是他们的元素是共享的 通过下图运行结果可以看到,a和b是不同的对象,但是当我改变a的元素的时候,b的元 阅读全文
posted @ 2019-08-03 11:31 地球上最后一个直男 阅读(189) 评论(0) 推荐(0)
摘要:运行结果如下,利用[0, 1, 2]作为行索引, [0,1, 2]作为列索引,输出了a[0, 0], a[1, 1], a[2, 3]。 阅读全文
posted @ 2019-08-03 11:26 地球上最后一个直男 阅读(640) 评论(0) 推荐(0)