随笔分类 -  python机器学习

主要是积累在学习机器学习过程中遇到的python知识和一些模块,函数。
摘要:转载至:https://blog.csdn.net/shenpengjianke/article/details/29356755 上一篇介绍了numpy.linspace用于创建等差数列,现在介绍logspac用于创建等比数列。其实用法差不多,但是有一个特殊的地方需要注意。 ● 先来看一个例子,我 阅读全文
posted @ 2019-11-23 22:15 地球上最后一个直男 阅读(882) 评论(0) 推荐(0)
摘要:import pandas as pd import numpy as np import matplotlib.pyplot as plt name = np.array([['jack', 'ross', 'john', 'blues', 'frank', 'bitch', 'haha', 'a 阅读全文
posted @ 2019-11-23 21:27 地球上最后一个直男 阅读(1959) 评论(0) 推荐(0)
摘要:我草泥马!!!!!loc取值的时候行索引从0开始,代表第一行, iloc取值行索引也从0开始,还有 一定要记得记得记得记得每次清洗完数据之后用data.rest_index(inplate=True)重置索引 一:生成数据 1. make_blobs(from sklearn.datasets.sa 阅读全文
posted @ 2019-09-23 23:38 地球上最后一个直男 阅读(817) 评论(0) 推荐(0)
摘要:concatenate() 我们先来介绍最全能的concatenate()函数,后面的几个函数其实都可以用concatenate()函数来进行等价操作。 concatenate()函数根据指定的维度,对一个元组、列表中的list或者ndarray进行连接,函数原型: numpy.concatenat 阅读全文
posted @ 2019-08-15 16:33 地球上最后一个直男 阅读(16510) 评论(0) 推荐(0)
摘要:作者:忆臻链接:https://www.zhihu.com/question/22178202/answer/161732605来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 作者:忆臻链接:https://www.zhihu.com/question/2217820 阅读全文
posted @ 2019-08-10 09:43 地球上最后一个直男 阅读(12021) 评论(0) 推荐(2)
摘要:转载至:https://blog.csdn.net/m0_38061927/article/details/77198990 1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型作出的分类判断两个标准进行汇总。这个名字来源于它可以非常 阅读全文
posted @ 2019-08-09 10:43 地球上最后一个直男 阅读(1512) 评论(0) 推荐(0)
摘要:转载至:https://www.cnblogs.com/haiyan123/p/9804091.html 1、介绍itertools 是python的迭代器模块,itertools提供的工具相当高效且节省内存。使用这些工具,你将能够创建自己定制的迭代器用于高效率的循环。- 无限迭代器 itertoo 阅读全文
posted @ 2019-08-07 22:59 地球上最后一个直男 阅读(522) 评论(0) 推荐(0)
摘要:这个错误真的tmd伤脑筋。我用idxmax函数去求series类型的最大值的索引,结果明明是下面这种数据, 无论我如何pint他的shape,type,他怎么看都是一个满足idxmax函数要求的参数类型:标准的Series类型,且每个元素都是浮点数, 但是: 然鹅,当我最后在调试中看到了一个不起眼的 阅读全文
posted @ 2019-08-07 15:15 地球上最后一个直男 阅读(3501) 评论(1) 推荐(0)
摘要:转载至:https://www.cnblogs.com/liulangmao/p/9211537.html pandas Series 的 argmax 方法和 idxmax 方法用于获取 Series 的最大值的索引值: 举个栗子: 有一个pandas Series,它的索引是国家名,数据是就业率 阅读全文
posted @ 2019-08-07 11:57 地球上最后一个直男 阅读(1686) 评论(0) 推荐(0)
摘要:DataFram类型的变量a,设a有n个样本,m个特征,当执行语句b = a.values后,b为(n, m)的ndarray矩阵类型,当执行c = b.ravel()后,c为(n*m,)维行向量 阅读全文
posted @ 2019-08-06 09:05 地球上最后一个直男 阅读(675) 评论(0) 推荐(0)
摘要:交叉验证的原理放在后面,先看函数。 设X是一个9*3的矩阵,即9个样本,3个特征,y是一个9维列向量,即9个标签。现在我要进行3折交叉验证。 执行kFold = KFold(n_splits=3) :其中KFold是一个类,n_split=3表示,当执行KFold的split函数后,数据集被分成三份 阅读全文
posted @ 2019-08-05 21:10 地球上最后一个直男 阅读(21515) 评论(0) 推荐(6)
摘要:可以通过.columns和.index着两个属性返回数据集的列索引和行索引 设data是pandas的一个DataFram类型的数据集。 则data.index返回一个index类型的行索引列表,data.index.values返回的是行索引组成的ndarray类型。 则data.columns返 阅读全文
posted @ 2019-08-05 10:58 地球上最后一个直男 阅读(29632) 评论(0) 推荐(0)
摘要:转载至:https://blog.csdn.net/w_weiying/article/details/81411257 loc函数:通过行索引 "Index" 中的具体值来取行数据(如取"Index"为"A"的行) iloc函数:通过行号来取行数据(如取第二行的数据) 本文给出loc、iloc常见 阅读全文
posted @ 2019-08-04 18:44 地球上最后一个直男 阅读(6370) 评论(0) 推荐(2)
摘要:原文链接:https://blog.csdn.net/weixin_39175124/article/details/79463993 数据在前处理的时候,经常会涉及到数据标准化。将现有的数据通过某种关系,映射到某一空间内。常用的标准化方式是,减去平均值,然后通过标准差映射到均至为0的空间内。系统会 阅读全文
posted @ 2019-08-04 18:18 地球上最后一个直男 阅读(4518) 评论(0) 推荐(1)
摘要:原文链接:https://www.jianshu.com/p/f0ed06cd5003 import pandas as pd df = pd.DataFrame(……) 说明:以下“df”为DataFrame对象。 1. df. sort_values() 作用:既可以根据列数据,也可根据行数据排 阅读全文
posted @ 2019-08-04 11:33 地球上最后一个直男 阅读(24219) 评论(0) 推荐(1)
摘要:原文链接:https://www.jianshu.com/p/f773b4b82c66 value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对 阅读全文
posted @ 2019-08-04 11:27 地球上最后一个直男 阅读(12888) 评论(0) 推荐(1)
摘要:原文链接:https://blog.csdn.net/xtingjie/article/details/72510834 numpy中包含的newaxis可以给原数组增加一个维度 np.newaxis放的位置不同,产生的新数组也不同 一维数组 由以上代码可以看出,当把newaxis放在前面的时候 以 阅读全文
posted @ 2019-08-03 23:58 地球上最后一个直男 阅读(3553) 评论(0) 推荐(0)
摘要:原文链接:https://blog.csdn.net/yanwucao/article/details/80211984 DataFrame.insert(loc, column, value, allow_duplicates=False) Insert column into DataFrame 阅读全文
posted @ 2019-08-03 21:36 地球上最后一个直男 阅读(3953) 评论(0) 推荐(0)
摘要:原文链接 https://blog.csdn.net/m0_38103546/article/details/79935671 阅读全文
posted @ 2019-07-31 21:32 地球上最后一个直男 阅读(655) 评论(0) 推荐(0)
摘要:查看数据的前五行 tips = sns.load_dataset("tips") tips.head() 引入数据,布置横向画布 g = sns.FacetGrid(tips, col='time') g = sns.FacetGrid(tips, col='time')g.map(plt.hist 阅读全文
posted @ 2019-07-31 17:04 地球上最后一个直男 阅读(725) 评论(0) 推荐(1)