python数据分析之numpy+pandas+scipy+matplotlib+scikit-learn安装

摘要: 利用python来进行数据分析的时候,需要安装一些常见的工具包,如numpy,pandas,scipy等等,在安装的过程中,经常遇到一些安装细节的问题,如版本不匹配,需要依赖包没有正确安装等等,本文汇总梳理了下几个必要安装包的安装步骤,希望对读者有帮助,环境是windows 64 bit+python2.7.11。 阅读全文
posted @ 2016-10-27 18:17 克雷1+8 阅读(648) 评论(0) 推荐(0) 编辑

python数据分析进阶之pandas

摘要: Pandas是基于numpy来构建的,让numpy为中心的应用变得更加简单。Pandas主要包括两个数据结构,Series和DataFrame。既能处理时间序列的数据也能处理非时间序列的数据,同时在处理缺省值上面非常灵活。 阅读全文
posted @ 2016-10-22 14:30 克雷1+8 阅读(778) 评论(0) 推荐(0) 编辑

python数据分析进阶之numpy

摘要: Numpy是利用python来进行数据分析中必须要掌握的基础。是高性能科学计算和数据分析的基础包。利用numpy能对整组数据无需循环就能进行快速的标准数学函数计算,同时能进行线性代数,随机数,以及傅里叶变换等等功能,而对于数据分析来说,比较重要的用途就是数据的清理,过滤,子集构造,转换,排序,描述统计等等。 阅读全文
posted @ 2016-10-07 18:58 克雷1+8 阅读(2304) 评论(0) 推荐(0) 编辑

利用R语言+逻辑回归实现自动化运营

摘要: 逻辑回归是最常见的二分类算法之一,由于是有监督学习,训练阶段需要输入标签,而同时在变量较多的情况下,需要先经过一些降维处理,本文主要讲解如果通过R语言来自动化实现变量的降维以及变量转换,训练,测试,覆盖率以及准确度效果评估,以及生成最终评分配置表,而在标签与训练数据在可以自动化生成的情况下,配置表是能自动生成的。其中每个步骤都有详细的实现代码。 阅读全文
posted @ 2016-10-06 12:16 克雷1+8 阅读(6312) 评论(1) 推荐(0) 编辑

常见机器学习算法原理+实践系列6(朴素贝叶斯分类)

摘要: 介绍朴素贝叶斯的基本原理,接着使用python来实现分类算法。 阅读全文
posted @ 2016-10-02 16:19 克雷1+8 阅读(359) 评论(0) 推荐(0) 编辑

常见机器学习算法原理+实践系列5(KNN分类+Keans聚类)

摘要: 介绍KNN有监督分类以及Kmeans无监督聚类的原理以及简单实践例子。 阅读全文
posted @ 2016-10-01 16:20 克雷1+8 阅读(933) 评论(0) 推荐(0) 编辑

常见机器学习算法原理+实践系列4(决策树)

摘要: 简单介绍决策树的原理,然后python代码来进行实践,使用信息增益作为分裂规则 阅读全文
posted @ 2016-09-21 20:58 克雷1+8 阅读(266) 评论(0) 推荐(0) 编辑

常见机器学习算法原理+实践系列3(PCA)

摘要: PCA主要用来降维,挑选特征 阅读全文
posted @ 2016-09-21 20:49 克雷1+8 阅读(207) 评论(0) 推荐(0) 编辑

常见机器学习算法原理+实践系列2(SVD)

摘要: 介绍奇异值分解+python代码实践,SVD在图片压缩以及推荐系统中有广泛的应用场景 阅读全文
posted @ 2016-09-21 20:43 克雷1+8 阅读(378) 评论(0) 推荐(0) 编辑

常见机器学习算法原理+实践系列1(逻辑回归)

摘要: 逻辑回归原理+python代码实践 阅读全文
posted @ 2016-09-21 20:37 克雷1+8 阅读(608) 评论(0) 推荐(0) 编辑