上一页 1 ··· 38 39 40 41 42 43 44 45 46 ··· 52 下一页
摘要: 正负样本数据集符合独立同分布是构建机器学习模型的前提,从概率的角度分析,样本数据独立同分布是正负样本数据从某一定的数据分布随机抽取的,且正负样本的分布是不一样的。举例来说,若我们用非洲的西瓜作为训练集,然后用中国西瓜作为测试集,则数据集可能不满足同分布这一前提;抛硬币是最简单的独立同分布;用专业术语 阅读全文
posted @ 2019-01-03 16:01 做梦当财神 阅读(3870) 评论(0) 推荐(0)
摘要: 机器学习中,将数据集划分为训练集、验证集、测试集。训练集构建模型,然后用模型计算测试集的测试误差,最后以测试集的测试误差近似为模型的泛化能力,根据泛化能力来评估模型的优劣。 本文首先引入数据集概率分布的概念,然后介绍模型评估方法。 1. 数据集的概率分布 总体样本服从某一分布P(X),数据集D是从总 阅读全文
posted @ 2018-12-29 16:22 做梦当财神 阅读(3123) 评论(0) 推荐(0)
摘要: 利用Python字典统计 利用Python的collection包下Counter类统计 利用Python的pandas包下的value_counts类统计 字典统计 a = [1, 2, 3, 1, 1, 2] dict = {} for key in a: dict[key] = dict.ge 阅读全文
posted @ 2018-09-28 20:25 做梦当财神 阅读(37859) 评论(0) 推荐(2)
摘要: 来自:Python那些事 pandas中accessor功能很强大,可以将它理解为一种属性接口,通过它获得额外的方法。 下面用代码和实例理解一下: 对于Series数据结构使用_accessors方法,我们得到3个对象:cat, str, dt。 .cat:用于分类数据(Categorical da 阅读全文
posted @ 2018-09-28 09:38 做梦当财神 阅读(1452) 评论(0) 推荐(1)
摘要: iterrows(): 将DataFrame迭代为(insex, Series)对。 itertuples(): 将DataFrame迭代为元祖。 iteritems(): 将DataFrame迭代为(列名, Series)对 现有如下DataFrame数据: iterrows(): iterite 阅读全文
posted @ 2018-09-19 11:01 做梦当财神 阅读(23460) 评论(0) 推荐(2)
摘要: 在pandas里面常用value_counts确认数据出现的频率。 1. Series 情况下: pandas 的 value_counts() 函数可以对Series里面的每个值进行计数并且排序。 import pandas as pd df = pd.DataFrame({'区域' : ['西安 阅读全文
posted @ 2018-09-17 19:43 做梦当财神 阅读(71940) 评论(2) 推荐(2)
摘要: 来自:刘建平 1.概述 在scikit-learn中,与逻辑回归有关的主要有3个类。LogisticRegression, LogisticRegressionCV 和 logistic_regression_path。其中LogisticRegression 和 LogisticRegressio 阅读全文
posted @ 2018-09-15 10:38 做梦当财神 阅读(643) 评论(0) 推荐(0)
摘要: 直接赋值:即对象的引用。 **浅拷贝(copy):**拷贝父对象,不会拷贝对象内部的子对象。 深拷贝(deepcopy):copy 模块的 deepcopy 方法,完全拷贝父对象及其子对象。 实例: 字典浅拷贝 a = {1: [1, 2 ,3]} b = a.copy() print(a, b) 阅读全文
posted @ 2018-09-10 22:33 做梦当财神 阅读(221) 评论(0) 推荐(0)
摘要: 来自:爱抠脚的coder np.split(): 该函数的参数要么按照数字划分(int),要么是按列表list划分:如果仅是输入一个int类型的数字,你的数组必须是均等的分割,否则会报错。 np.array_split(): array_split()可以进行不均等划分。 按列表中的数字,在3,5, 阅读全文
posted @ 2018-07-26 14:46 做梦当财神 阅读(5683) 评论(0) 推荐(0)
摘要: 目录一、回归模型评估1.均方误差2.绝对误差3.r24.可解释方差二、分类模型评估1.错误率与准确率2.精确率、召回率、F13. ROC 与 AUC 对机器学习泛化能力的评估,不仅需要可行的估计方法,还需要衡量模型泛化能力的标准,这就是性能度量(\(performance\ measure\))。 阅读全文
posted @ 2018-07-25 17:47 做梦当财神 阅读(3592) 评论(0) 推荐(0)
上一页 1 ··· 38 39 40 41 42 43 44 45 46 ··· 52 下一页