2016年9月6日

Sklearn库例子4:分类——Lasso分类例子

摘要: Lasso回归: 输出: 阅读全文

posted @ 2016-09-06 14:11 波比12 阅读(8149) 评论(1) 推荐(0) 编辑

2016年9月5日

Sklearn库例子3:分类——岭回归分类(Ridge Regression )例子

摘要: 为了解决数据的特征比样本点还多的情况,统计学家引入了岭回归。 岭回归通过施加一个惩罚系数的大小解决了一些普通最小二乘的问题。回归系数最大限度地减少了一个惩罚的误差平方和。 这里是一个复杂的参数,用来控制收缩量,其值越大,就有更大的收缩量,从而成为更强大的线性系数。 Ridge和Line_Model一 阅读全文

posted @ 2016-09-05 13:54 波比12 阅读(7745) 评论(0) 推荐(0) 编辑

2016年9月2日

Sklearn库例子2:分类——线性回归分类(Line Regression )例子

摘要: 线性回归:通过拟合线性模型的回归系数W =(w_1,…,w_p)来减少数据中观察到的结果和实际结果之间的残差平方和,并通过线性逼近进行预测。 从数学上讲,它解决了下面这个形式的问题: LinearRegression()模型在Sklearn.linear_model下,他主要是通过fit(x,y)的 阅读全文

posted @ 2016-09-02 14:22 波比12 阅读(10979) 评论(0) 推荐(0) 编辑

2016年9月1日

Sklearn库例子1:Sklearn库中AdaBoost和Decision Tree运行结果的比较

摘要: DisCrete Versus Real AdaBoost 关于Discrete 和Real AdaBoost 可以参考博客:http://www.cnblogs.com/jcchen1987/p/4581651.html 本例是Sklearn网站上的关于决策树桩、决策树、和分别使用AdaBoost 阅读全文

posted @ 2016-09-01 15:10 波比12 阅读(7239) 评论(1) 推荐(0) 编辑

2016年8月31日

《Python自然语言处理》中文版-纠错【更新中。。。】

摘要: 最近在看《Python自然语言处理》中文版这本书,可能由于是从py2.x到py3.x,加上nltk的更新的原因,或者作者的一些笔误,在书中很多代码都运行不能通过,下面我就整理一下一点有问题的代码。 第一章: p3.该处为小建议,书中没有错误:关于nltk.book的下载,最好下载到'/nltk_da 阅读全文

posted @ 2016-08-31 14:43 波比12 阅读(2935) 评论(1) 推荐(0) 编辑

自然语言处理1——语言处理与Python(内含纠错)

摘要: 学习Python自然语言处理,记录一下学习笔记。 运用Python进行自然语言处理需要用到nltk库,关于nltk库的安装,我使用的pip方式。 或者下载whl文件进行安装。(推荐pip方式,简单又适用)。 安装完成后就可以使用该库了,但是还需要下载学习所需要的数据。启动ipython,键入下面两行 阅读全文

posted @ 2016-08-31 11:03 波比12 阅读(5377) 评论(0) 推荐(2) 编辑

2016年8月25日

python [吐槽]关于nan类型时遇到的问题

摘要: 今天在用写一段求和的代码时候,发现最后返回的是nan的结果,这段循环求和代码依次调用了三个函数,于是依次打印这三个函数的返回值,发现其中一个函数的返回值为nan,原来是因为这段函数里面没有相似的用户,所有返回结果为nan,于是我就想加一个判断条件,当结果为空时,跳过本次循环: 本以为加上这一句话就可 阅读全文

posted @ 2016-08-25 14:34 波比12 阅读(26092) 评论(0) 推荐(3) 编辑

2016年8月22日

[机器学习之13]降维技术——主成分分析PCA

摘要: 始终贯彻数据分析的一个大问题就是对数据和结果的展示,我们都知道在低维度下数据处理比较方便,因而数据进行简化成为了一个重要的技术。对数据进行简化的原因: 1.使得数据集更易用使用。2、降低很多算法的计算开销。3、去除噪音、4.使得结果易懂 这里我们关心的数据降维技术为主成分分析(PCA)。在PCA中, 阅读全文

posted @ 2016-08-22 21:01 波比12 阅读(1584) 评论(0) 推荐(0) 编辑

numpy下的flatten()函数用法

摘要: flatten是numpy.ndarray.flatten的一个函数,其官方文档是这样描述的: Return a copy of the array collapsed into one dimension. Parameters: order : {‘C’, ‘F’, ‘A’, ‘K’}, opt 阅读全文

posted @ 2016-08-22 19:59 波比12 阅读(68769) 评论(0) 推荐(3) 编辑

2016年8月18日

Python 列表如何获得一个指定元素所在的下标

摘要: 在使用Python3.4读取txt数据到列表,由于编码问题,读取到的数据通常会出现'\ufeffX'(x为你想要的数据)。这时候如果需要把列表中的数据由字符串转换到数值型的数据的进行数据分析的话就会出现问题,我们可以采取获取到该异常数据所在的位置,将该位置换成格式合适的数据。 那么Python列表如 阅读全文

posted @ 2016-08-18 15:36 波比12 阅读(88509) 评论(3) 推荐(0) 编辑

导航