摘要: 案例:通过使用R语言的聚类算法将用户进行合理的划分,找出对超市贡献度,光临度最高的优质客户,对后期的推广有更深远的影响 1.导入包 2.加载数据集 3.查看数据集 4.数据集预处理(将三个数据集合并成一个数据集,通过cust_id进行关联) 结论:将所有的纵向表转换成横向表,同时把所有数据集的所有字 阅读全文
posted @ 2018-03-25 12:05 月上贺兰 阅读(937) 评论(0) 推荐(0) 编辑
摘要: 案例分析:拍拍贷是中国的一家在线借贷平台,网站撮合了一些有闲钱的人和一些急用钱的人。用户若有贷款需求,可在网站上选择借款金额。 本项目拟通过该数据集的探索,结合自己的理解进行分析,最终目的的是初步预测贷款的利率和哪些因素有关。 0.加载包 1.探索数据集 结论:一共有328553个对象,21个变量 阅读全文
posted @ 2018-03-12 11:12 月上贺兰 阅读(1615) 评论(0) 推荐(0) 编辑
摘要: 使用动画可以使得图形更形象,更能反映数据的变化 1.安装环境gganimate 2.加载包 3.加载数据集 结论:该数据集是Rladies数据集,是一个全球女权组织的社区,主要改变性别歧视 主要字段:screen_name 社区名称 location 地点 created_at 创建时间 follo 阅读全文
posted @ 2018-03-07 23:20 月上贺兰 阅读(760) 评论(0) 推荐(0) 编辑
摘要: 时间序列:可以用来预测未来的参数, 1.生成时间序列对象 结论:手动生成的时序图 2.简单移动平均 案例:尼罗河流量和年份的关系 结论:随着K值的增大,图像越来越平滑我们需要找到最能反映规律的K值 3.使用stl做季节性分解 案例:Arirpassengers年份和乘客的关系 原始图 对数变换 总体 阅读全文
posted @ 2018-03-04 11:31 月上贺兰 阅读(7712) 评论(0) 推荐(1) 编辑
摘要: 请选用MySQL进行测试. 1.将男性和女性的工资互换(E) 思路:使用case when进行条件判断,在使用update进行修改 1 update salary 2 set sex = 3 case sex 4 when 'm' then 'f' 5 else 'm' 6 end 2.找出desc 阅读全文
posted @ 2018-03-01 23:22 月上贺兰 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 一.聚类: 一般步骤: 1.选择合适的变量 2.缩放数据 3.寻找异常点 4.计算距离 5.选择聚类算法 6.采用一种或多种聚类方法 7.确定类的数目 8.获得最终聚类的解决方案 9.结果可视化 10.解读类 11.验证结果 1.层次聚类分析 案例:采用flexclust的营养数据集作为参考 1.基 阅读全文
posted @ 2018-02-28 23:20 月上贺兰 阅读(11832) 评论(0) 推荐(0) 编辑
摘要: 请选用MySQL进行测试. 1.找出后一天比前一天温度高的日期(E) 思路:将该表进行自关联,然后选择出日期靠后的一天,最后选择温度高的日期 1 select Weather.Id 2 from Weather join Weather w 3 on datediff(Weather.Date,w. 阅读全文
posted @ 2018-02-26 00:55 月上贺兰 阅读(1043) 评论(0) 推荐(3) 编辑
摘要: 案例分析:Prosper是美国的一家P2P在线借贷平台,网站撮合了一些有闲钱的人和一些急用钱的人。用户若有贷款需求,可在网站上列出期望数额和可承受的最大利率。潜在贷方则为数额和利率展开竞价。 本项目拟通过该数据集的探索,结合自己的理解进行分析,最终目的的是初步预测哪些人贷款后会还款、哪些人会赖账。 阅读全文
posted @ 2018-02-25 00:07 月上贺兰 阅读(1307) 评论(0) 推荐(2) 编辑
摘要: 1.PCA 使用场景:主成分分析是一种数据降维,可以将大量的相关变量转换成一组很少的不相关的变量,这些无关变量称为主成分 步骤: 案例:从USJudgeRatings数据集中有11个变量,如何去减化数据(单个主成分分析) 1.使用碎石图确定需要提取的主成分个数 结论:在特征值大于1的的点附近,都表明 阅读全文
posted @ 2018-02-24 00:53 月上贺兰 阅读(14148) 评论(0) 推荐(0) 编辑
摘要: 使用场景:结果变量是类别型,二值变量和多分类变量,不满足正态分布 结果变量是计数型,并且他们的均值和方差都是相关的 解决方法:使用广义线性模型,它包含费正太因变量的分析 1.Logistics回归(因变量为类别型) 案例:匹配出发生婚外情的模型 1.查看数据集的统计信息 结果:该数据从601位参与者 阅读全文
posted @ 2018-02-23 00:11 月上贺兰 阅读(6835) 评论(0) 推荐(1) 编辑