上一页 1 2 3 4 5 6 7 8 9 10 ··· 52 下一页
摘要: K均值聚类思想   聚类的核心概念是相似度或距离,有很多相似度或距离的方法,比如欧式距离、马氏距离、相关系数、余弦定理、层次聚类和K均值聚类等   K均值聚类的基本思想是,通过迭代的方法寻找K个簇的一种划分方案,使得聚类结果对应的代价函数最小,特别地,代价函数 阅读全文
posted @ 2019-04-10 16:12 Fate0729 阅读(1615) 评论(1) 推荐(0)
摘要: 当数据集的数值属性具有非常大的比例差异,往往导致机器学习的算法表现不佳,当然也有极少数特例。在实际应用中,通过梯度下降法求解的模型通常需要归一化,包括线性回归、逻辑回归、支持向量机、神经网络等模型。但对于决策树不使用,以C4.5为例,决策树在进行节点分裂时主要依据数据集D关于特征X的信息增益比,而信 阅读全文
posted @ 2019-04-05 13:44 Fate0729 阅读(1178) 评论(0) 推荐(0)
摘要: 类别型特征原始输入通常是字符串形式,除了决策树等少数模型能直接处理字符串形式的输入,对于逻辑回归、支持向量机等模型来说,类别型特征必须经过处理转换成数值型。Sklearn中提供了几个转换器来处理文本属性,下面将总结LabelEncode(序号编码)、OneHotEncoder(独热编码)和Label 阅读全文
posted @ 2019-03-28 18:07 Fate0729 阅读(1563) 评论(0) 推荐(0)
摘要: 1. Series对象 由于series对象很简单,跟数组类似,但多了一些额外的功能,偷个懒,用思维导图表示 2. DaraFrame对象 DataFrame将Series的使用场景由一维扩展到多维,数据结构跟Excel工作表极为相似,说白了就是矩阵 1. 定义DataFrame对象 DataFra 阅读全文
posted @ 2019-03-22 09:44 Fate0729 阅读(713) 评论(0) 推荐(1)
摘要: 回归是对一个或多个自变量和因变量之间的关系进行建模,求解的一种统计方法,之前的博客中总结了在线性回归中使用最小二乘法推导最优参数的过程和logistic回归,接下来将对最小二乘法、局部加权回归、岭回归和前向逐步回归算法进行依次说明和总结 1. 用线性回归找到最佳拟合曲线 (1)回归的一般方法 收集数 阅读全文
posted @ 2019-01-14 17:43 Fate0729 阅读(2217) 评论(0) 推荐(1)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 52 下一页