上一页 1 2 3 4 5 6 ··· 10 下一页

2020年4月25日

摘要: 本文介绍了OLAP数据立方体的基本定义和要素,以及数据分析时对立方体的基本操作类型和在商业软件中对立方体进行操作的MDX语言。 阅读全文
posted @ 2020-04-25 22:58 camash 阅读(862) 评论(0) 推荐(1) 编辑

2020年4月7日

摘要: 本文从业务分析的归因/相关性分析的方式,引入了维度建模,两者具有相同分析路径。然后介绍了维度建模的基础——事实表和维度表,它们关联之后的产物即星型模型。 阅读全文
posted @ 2020-04-07 22:16 camash 阅读(1282) 评论(0) 推荐(1) 编辑

2020年3月29日

摘要: 近几年随着「大数据」、「数据驱动」、「数据中台」等概念在互联网界的热炒,懂数据的获取、处理到算法推荐、模型预测等人才也得到热捧。观感上,这些技能领域是随着大数据时代而来的。而实际上,早在上世纪80年到90年代初数据仓库和数据决策支持系统概念已经提出,本质上都是将多源头的数据集中起来,采用统计学的方法 阅读全文
posted @ 2020-03-29 21:42 camash 阅读(2143) 评论(0) 推荐(1) 编辑

2020年2月2日

摘要: 为了解决我的macbook pro 13在Mojave下的闪屏问题,将系统更新到了Catalina。使用MacVim是发现部分字符的下半部分显示不全,如g, q的下部分。尝试在配置文件中调整字体大小和行间距都不能解决问题。 但是,如果通过command + 进行缩放后,显示就正常了。怀疑是兼容性问题 阅读全文
posted @ 2020-02-02 22:46 camash 阅读(494) 评论(0) 推荐(0) 编辑

2020年1月11日

摘要: 结合 "假设检验" 的理论知识,本文使用Python对实际数据进行假设检验。 导入测试数据 从线上下载测试数据文件,数据链接:https://pan.baidu.com/s/1t4SKF6U2yyjT365FaE692A 数据字段说明: gender:性别,1为男性,2为女性 Temperature 阅读全文
posted @ 2020-01-11 16:41 camash 阅读(7924) 评论(0) 推荐(2) 编辑

2019年12月15日

摘要: 假如要对一份统计数据进行分析,一般其来源来自于社会调研/普查,所以数据不是总体而是一定程度的抽样。对于抽样数据的分析,就可以结合上篇 "统计量及其抽样分布" 的内容,判断数据符合哪种分布。使用已知分布特性,可以完成对总体的统计分析。 本文使用python函数判断数据集是否符合特定抽样分布。 数据来源 阅读全文
posted @ 2019-12-15 21:33 camash 阅读(2233) 评论(0) 推荐(1) 编辑

2019年12月1日

摘要: 接上篇 "概率分布" ,这篇文章讲概率分布在python的实现。 文中的公式使用LaTex语法,即在\begin{equation}至\end{equation}的内容可以在 "https://www.codecogs.com/latex/eqneditor.php?lang=zh cn" 页面转换 阅读全文
posted @ 2019-12-01 21:41 camash 阅读(8476) 评论(0) 推荐(0) 编辑

2019年11月17日

摘要: 目前,做数据分析工作,基本人手Numpy,pandas,scikit learn。而这些计算程序包都是基于python平台的,所以搞数据的都得先装个python环境。。。(当然,你用R或Julia请忽略本文) 在macOS上,默认安装有python 2.7,鉴于python2即将停止更新,如果没有大 阅读全文
posted @ 2019-11-17 18:15 camash 阅读(2507) 评论(0) 推荐(0) 编辑

2019年8月27日

摘要: k means算法在人群聚类场景中,是一个非常实用的工具。(该算法的原理可以参考 "K Means算法的Python实现" ) 常见调用方式 该算法常规的调用方式如下: 异常现象 常规情况下,以上处理后,会根据dataframe上的索引列顺序的 (0~8的数值)。 但是,我们在执行代码过程中,出现了 阅读全文
posted @ 2019-08-27 22:06 camash 阅读(1673) 评论(0) 推荐(0) 编辑

2019年8月24日

摘要: 背景:将测试环境的中kettle转换传输到生产环境上出现hadoop插件无法获取的错误 原因 : 迁到生产后,因为服务器带了主机名,所以在插件配置中使用主机名,而非ip地址。 处理方式 : 将里面的主机名改成ip地址即可。若遇到hadoop插件未发现的问题,可以考虑使用此法。 参考链接 : "1" 阅读全文
posted @ 2019-08-24 22:40 camash 阅读(2042) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页

导航