上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 26 下一页
摘要: 变量之间存在着相关关系,比如,人的身高和体重之间存在着关系,一般来说,人高一些,体重要重一些,身高和体重之间存在的是不确定性的相关关系。回归分析是研究相关关系的一种数学工具,它能帮助我们从一个变量的取值区估计另一个变量的取值。 OLS(最小二乘法)主要用于线性回归的参数估计,它的思路很简单,就是求一 阅读全文
posted @ 2018-12-29 16:53 悦光阴 阅读(46887) 评论(0) 推荐(2) 编辑
摘要: 散点图用于描述两个连续性变量间的关系,三个变量之间的关系可以通过3D图形或气泡来展示,多个变量之间的两两关系可以通过散点图矩阵来展示。 一,添加了最佳拟合曲线的散点图 使用基础函数plot(x,y)来绘制散点图,其中x和y是数值型向量,代表着图形中的点(x,y) abline()函数用于添加最佳拟合 阅读全文
posted @ 2018-12-27 09:01 悦光阴 阅读(19324) 评论(0) 推荐(2) 编辑
摘要: Scipy中计算距离的模块是scipy.spatial.distance,最常用的方法是计算距离矩阵,换句话说,从存储在矩形数组中的观测向量集合中进行距离矩阵的计算。 一,两两距离 在n维空间中的观测值,计算两两之间的距离。距离值越大,相关度越小。 scipy.spatial.distance.pd 阅读全文
posted @ 2018-12-26 10:58 悦光阴 阅读(3428) 评论(0) 推荐(2) 编辑
摘要: 小仙女只喝露珠,不吃饭,媛的2018,奋斗和生活两不误,👍👍👍, 精神胜利法式年度报告 最终成绩:及格 详细指标: 完成了每个月读书的小指标的80%(杂七杂八的书全部完成目标,技术书籍阅读进度一言难尽。。。) 每年拿到两个证书小目标完成 80%(虽然大都靠运气飘过,还拿了一个获奖证书来凑数,但 阅读全文
posted @ 2018-12-24 14:44 悦光阴 阅读(1019) 评论(2) 推荐(4) 编辑
摘要: 包(Package)是实现特定功能的、预先写好的代码库(library),通俗地说,包是含有函数、数据等的功能模块。R拥有大量的软件包,许多包都是由某一领域的专家编写的,但并不是所有的包都有很高的质量。在使用包之前,最好到社区中了解其他网友的反馈。R预先安装了一系列的基础包,包括base、datas 阅读全文
posted @ 2018-12-21 14:47 悦光阴 阅读(1305) 评论(0) 推荐(1) 编辑
摘要: 模块是把程序代码和数据封装的Python文件,也就是说,每一个以扩展名py结尾的Python源代码文件都是一个模块。每一个模块文件就是一个独立的命名空间,用于封装顶层变量名;在一个模块文件的顶层定义的所有的变量名(函数名也是一个变量名),称作模块的属性。导入模块给予了对模块的全局作用域中的变量名的读 阅读全文
posted @ 2018-12-20 09:55 悦光阴 阅读(1058) 评论(0) 推荐(2) 编辑
摘要: 函数的参数是参数暴露给外部的接口,向函数传递参数,可以控制函数的流程,函数可以0个、1个或多个参数;在Python中向函数传参,使用的是赋值方式。 一,传递参数 参数是通过赋值来传递的,传递参数的特点是: 参数的传递是通过自动把对象赋值给函数的本地变量名来实现的, 在函数内部的变量名的赋值不会影响调 阅读全文
posted @ 2018-12-19 09:26 悦光阴 阅读(939) 评论(0) 推荐(2) 编辑
摘要: 函数是把一些语句集合在一起的程序结构,用于把复杂的流程细分成不同的组件,能够减少代码的冗余、代码的复用和修改代码的代价。 函数可以0个、1个或多个参数,向函数传递参数,可以控制函数的流程。函数还可以返回代码执行的结果,从技术上讲,任何函数都要返回结果,一个没有返回值的函数会自动返回none对象。如果 阅读全文
posted @ 2018-12-18 08:35 悦光阴 阅读(1717) 评论(0) 推荐(2) 编辑
摘要: Python中的迭代是指按照元素的顺序逐个调用的过程,迭代概念包括:迭代协议、可迭代对象和迭代器三个概念。 迭代协议是指有__next__()函数的对象会前进到下一个结果,而到达系列的末尾时,则会引发StopIteration异常。为了支持迭代协议,Python内置了两个函数:iter()和next 阅读全文
posted @ 2018-12-17 10:44 悦光阴 阅读(1308) 评论(2) 推荐(4) 编辑
摘要: Python的变量不用声明,赋值之后就可以直接使用,类型是在运行过程中自动确定的,这就是动态类型模型。该模型把变量和对象设计成两个不同的实体,对象是存储数据的地方,对象的类型是由初始值自动决定的,而变量仅仅是对象的引用。变量是通用的,同一个变量名可以引用任何类型的对象。 一,变量、对象和引用 动态类 阅读全文
posted @ 2018-12-16 16:08 悦光阴 阅读(1288) 评论(3) 推荐(2) 编辑
摘要: 前记:这是我老婆写的一篇文章,结合了她当前的分析工作和物联网,介绍了物联网环境下数据分析的应用。 物联网概论及国内外研究现状 “物联网概念”是在“互联网概念”的基础上,将其用户端延伸和扩展到任何物品与物品之间,进行信息交换和通信的一种网络概念。 物联网(Internet of Things),国内外 阅读全文
posted @ 2018-12-12 07:18 悦光阴 阅读(2440) 评论(0) 推荐(5) 编辑
摘要: Python的对象分为变量和常量,常量的值是字面意思,其值是不可变的;变量的值是可变的,例如,123,"上海"是常量,而a=1,a=2,其中a是变量名。内置的核心数据类型有:数字、字符串、列表(list)、字典(dictionary)、元组(tuple)、文件、集合(set)、None和布尔(boo 阅读全文
posted @ 2018-12-11 13:08 悦光阴 阅读(1713) 评论(0) 推荐(3) 编辑
摘要: 致敬那些漂泊在外的务工者,你们是一群有梦想的人! 1 现状 本人沪漂一族,有次坐高铁去杭州,由于没有买到有座位的车票,想着路途不远,就买了站票。后来站累了,我发现一节特别的车厢有很多空的座位,看起来很豪华,很舒服的样子,我没多想,就径直坐了上去。坐了不一会儿,来了位美女乘务员查票,把我赶了出去,原来 阅读全文
posted @ 2018-12-06 15:19 悦光阴 阅读(7445) 评论(150) 推荐(102) 编辑
摘要: 前记:这是我老婆随手写的一篇文章,结合了她当前的分析工作和云计算,介绍了云计算对大数据分析的助力。 在互联网后时代,数据分析已经成为企业保持竞争力的必要方法。企业在成长和发展的过程中积累了海量的数据,这些历史数据不管是通过纸质媒介,还是通过硬盘记录下来,都是企业宝贵的数据资产。对数据进行数字化处理, 阅读全文
posted @ 2018-11-26 10:30 悦光阴 阅读(1469) 评论(0) 推荐(4) 编辑
摘要: DAX表达式中包含时间智能(Time Intelligence)相关的函数,用于对日期维度进行累加、同比和环比等分析。PowerBI能够创建关系,通过过滤器来对影响计算的上下文。 DAX表达式有两种方式计算累加和,TOTALxTD()是DATESxTD()的语法糖,使得PowerBI对累加和的计算更 阅读全文
posted @ 2018-10-31 18:33 悦光阴 阅读(13705) 评论(0) 推荐(3) 编辑
摘要: 相关分析是数据分析的一个基本方法,可以用于发现不同变量之间的关联性,关联是指数据之间变化的相似性,这可以通过相关系数来描述。发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变世界。 一,协方差和相关系数 如果随机变量X和Y是相互独立的,那么协方差 Cov(X,Y) = E{ [X-E(X) 阅读全文
posted @ 2018-10-23 10:55 悦光阴 阅读(11467) 评论(4) 推荐(1) 编辑
摘要: 使用geom_bar()函数绘制条形图,条形图的高度通常表示两种情况之一:每组中的数据的个数,或数据框中列的值,高度表示的含义是由geom_bar()函数的参数stat决定的,stat在geom_bar()函数中有两个有效值:count和identity。默认情况下,stat="count",这意味 阅读全文
posted @ 2018-09-20 09:59 悦光阴 阅读(34951) 评论(3) 推荐(5) 编辑
摘要: 在真实的世界中,缺失数据是经常出现的,并可能对分析的结果造成影响。在R中,经常使用VIM(Visualization and Imputation of Missing values)包来对缺失值进行可视化和插补。在使用VIM绘图时,有些绘图函数会对缺失值会自动进行插补。 缺失数据的分类: MCAR 阅读全文
posted @ 2018-09-19 11:28 悦光阴 阅读(5480) 评论(0) 推荐(1) 编辑
摘要: 列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数分布表,它是由两个以上的变量进行交叉分类的频数分布表。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。 按两个变量交叉分类的,该列联表称为两维列联表;若按3个变量交叉分类,所得的列联表称为3维列联表,依次类推。一 阅读全文
posted @ 2018-09-19 10:21 悦光阴 阅读(18944) 评论(2) 推荐(1) 编辑
摘要: 贝叶斯公式:事件Bi的概率为P(Bi),在事件Bi发生条件下事件A发生的概率为P(A│Bi),在事件A发生条件下事件Bi发生的的概率为P(Bi│A)。 贝叶斯公式也称作逆全概率公式,我对贝叶斯概率公式的理解: 根据之前的经验,确定事件A是由事件B触发的,事件B有一个划分:B1、B2、...、Bn,每 阅读全文
posted @ 2018-09-18 17:16 悦光阴 阅读(1347) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 26 下一页