摘要: 一. 安装pandas1. Anaconda 安装pandas、Python和SciPy最简单的方式是用Anaconda。Anaconda是关于Python数据分析和科学计算的分发包。2. Miniconda 使用Anaconda会安装一百多个依赖包,如果想灵活控制安装的依赖包或带宽有限,使用Min... 阅读全文
posted @ 2015-04-08 02:43 *新*新* 阅读(5500) 评论(0) 推荐(0)
摘要: 原文作者:新浪微博@王小科科科本文由36大数据翻译组-大海翻译,转载必须获得本站、原作者、译者的同意,拒绝任何不表明译者及来源的转载!如何提高推荐算法的有效性?主要的方法是特征转化,模型选取,数据处理等等。降维是特征加工中的一个重要部分。这篇博文主要讲述如何利用降维方法来提高以用户为基础的协同过滤方... 阅读全文
posted @ 2015-04-08 02:31 *新*新* 阅读(969) 评论(0) 推荐(0)
摘要: ps: 转自2014-11-04 数据海洋BI临时需求处理规范及文档管理内容一、目的规范BI处理的临时需求。便于部门同事了解业务以及借鉴。二、临时需求的定义由业务部门向BI提出的一次性数据需求。主要用亍解决业务方某个点的问题。三、文档的内容在临时需求处理完成后,完成以下内容,放入到共享文件夹中。各个... 阅读全文
posted @ 2015-04-08 02:28 *新*新* 阅读(1127) 评论(0) 推荐(0)
摘要: 转载:http://bbs.pinggu.org/thread-3078817-1-1.html有人说Python和R的区别是显而易见的,因为R是针对统计的,python是给程序员设计的,其实这话对Python多多少少有些不公平。2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取... 阅读全文
posted @ 2015-04-08 02:24 *新*新* 阅读(9556) 评论(0) 推荐(0)
摘要: 转载:http://ices01.sinaapp.com/?p=129 R(又称R语言)是一款开源的跨平台的数值统计和数值图形化展现 工具。通俗点说,R是用来做统计和画图的。R拥有自己的脚本语言和大量的统计、图形库(得益于开源社区),这让她看起来既美又实用。与其他同类软件(如 SPSS)相比,R的... 阅读全文
posted @ 2015-04-08 02:23 *新*新* 阅读(3325) 评论(0) 推荐(0)
摘要: 1. 将环境变量PATH中加入C:\python2*\Scripts 或者C:\Program Files\Python 3.5\Scripts2. 进入pip.exe所在的目录:C:\Program Files\Python 3.5\Scripts3. pip3.5 install pandasD... 阅读全文
posted @ 2015-04-08 02:05 *新*新* 阅读(286) 评论(0) 推荐(0)