摘要:用Excel进行数据分析练习(一) 跟随秦路老师的课程,用Excel进行数据分析,主要目的是回顾关于Excel的一些基本操作 问题描述 数据: 一份餐食数据 主要问题描述: 全国点评数最高的饭店是哪家? 哪个城市的饭店人均口味最好? 哪个类型的餐饮评价最好? 类型为川菜的店里,有多少个带‘辣’字,有
        阅读全文
        | 06 2021 档案
摘要:用Excel进行数据分析练习(一) 跟随秦路老师的课程,用Excel进行数据分析,主要目的是回顾关于Excel的一些基本操作 问题描述 数据: 一份餐食数据 主要问题描述: 全国点评数最高的饭店是哪家? 哪个城市的饭店人均口味最好? 哪个类型的餐饮评价最好? 类型为川菜的店里,有多少个带‘辣’字,有
        阅读全文
 
摘要:写在前面的话  数据分析的方
        阅读全文
 
摘要:发私信来问我报告到底怎么做…… 为了不
        阅读全文
 
摘要:一、线性回归 1.定义 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线
        阅读全文
 
摘要:对于刚进入数据分析行业新手来说,EXCEL可以被当做一款入门的软件。在学习R或Python前,事先掌握一定的EXCEL知识是百利而无一害。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能,使你能够快速而深入的洞察到数据不轻易为人所知的一面。 但与此同时,EXCEL也有它的一些不
        阅读全文
 
摘要:项目来自阿里云天池 目录 提出问题(Business Understanding ) 理解数据(Data Understanding) 采集数据 导入数据 查看数据集信息 数据清洗(Data Preparation ) 缺失值处理 时间格式处理 体重数据的处理 虚拟变量 数据分析与数据可视化 构建模
        阅读全文
 
摘要:,主要用户在线交易处理。比如银行业务、电信业务之前很多都是Oracle或者DB2(可能现在很多开发者没再用过),到后来的互联网电商用的MySql,这些都是关系型数据库。 后来有了newSQL、NoSQL(not o
        阅读全文
 
摘要:销量下降的原因分析 利用结构化思维拆分销量。 对 “店铺销量构成” 进行拆解并分析不同类目的销量,进一步明确问题根源(哪几类商品销量下降最严重)。接下来我们针对每种品类去分析影响销量的因素有哪些,可能原因见图1。 
        阅读全文
 
摘要: B.
        阅读全文
 
摘要:假设检验分为参数假设检验和分布拟合假设检验和非参数检验 一、假设检验的思想: 建立假设 选择检验统计量并给出拒绝域形式 选择显著性水平 给出拒绝域 做出判断 二、p 值:利用样本观测值能够作出拒绝原假设的最小显著性水平 三、参数假设检验类型:详见茆诗松 正态总体参数假设检验 指数参数假设检验,对指数
        阅读全文
 
摘要:1、字符串组合 &可用于组合两个字符串 例如”a”&”b”可以得到ab,如果组合的字符串中含有双引号,可以加上转义符“
        阅读全文
 
摘要:1. 赛题背景 校园一卡通是集身份认证、金融消费、数据共享等多项功能于一体的信息集成系统。在为师生提供优质、高效信息化服务的同时,系统自身也积累了大量的历史记录,其中蕴含着学生的消费行为以及学校食堂等各部门的运行状况等信息。 很多高校基于校园一卡通系统进行“智慧校园”的相关建设,例如《扬子晚报》20
        阅读全文
 
摘要:从今天开始看 《Python数据分析实战》 这本书,今天看了这本书的第三章:Numpy部分,在书中看到了numpy中的两个方法numpy.column_stack与numpy.row_stack有一点自己的思考,先上代码: >>> import numpy as np >>> a = np.arra
        阅读全文
 
摘要:本文转自:http://blog.csdn.net/qq_27469517/article/details/53482563 整个第四章都是数据预处理。 4.1是数据清洗。就是处理无关数据,缺失或者异常数据等等。 具体看书,就不赘述了,还是上代码实践。 书上给的代码是有问题的! [python] v
        阅读全文
 
摘要:本文是基于《Python数据分析与挖掘实战》的实战部分的第10章的数据——《家用电器用户行为分析与事件识别》 做的分析。 接着前一篇文章的内容,本篇博文重点是处理用水事件中的属性构造部分,然后进行构建模型分析。 1 属性构造 由文中可知:需要构造的属性如下: 热水事件起始数据编号、终止数据编号、开始
        阅读全文
 
摘要:本文是基于《Python数据分析与挖掘实战》的实战部分的第12章的数据——《电子商务网站用户行为分析及服务推荐》做的分析。 由于此章内容很多,因此,分为三个部分进行分享——数据探索(上)、数据预处理(中)、模型构建(下) _ 本文是继前一篇文章,进行的工作。 本文是“ 数据预处理(中) ” 部分 _
        阅读全文
 
摘要:文章目录 1.挖掘背景与目标 2.2 数据探索与预处理 * 2.1 数据筛选 2.2 数据去重 2.3 删除前缀评分 2.4 jieba分词 3 基于LDA 模型的主题分析 4.权重 5.如何在主题空间比较两两文档之间的相似度 本文是基于《Python数据分析与挖掘实战》的实战部分的第15章的数据—
        阅读全文
 
摘要:第0周 Python基本语法元素 conda : 一个工具,用于包管理和环境管理,其中:包管理与pip类似,管理Python第三方库环境管理能够允许用户使用不同版本Python,并能灵活切换 anaconda :一个集合,包括conda、某版本Python、一批第三方库等 conda将工具、第三方库
        阅读全文
 
摘要:写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可。 地址是: [ http://github.com/pydata/pydata-book ](http://github.com/pydata/pydata- book) 还有一定要说明的: 我使用的是Python2.7,书中
        阅读全文
 
摘要:学习《利用Python进行数据分析》第二章的时候,处理1880-2010年间全美婴儿姓名数据,有句代码总是报错: total_births=names.pivot_table('births',rows='year',cols='sex',aggfunc=sum) [/code] 报错信息如下: `
        阅读全文
 
摘要:由于刚开始接触python的数据分析,第二章引言和第三章IPython就先略读了下,对能做的事和开发环境有了个大致的认识,但针对其中提到的一些优势还有没体会,回头再重新看。今天直接学习python数据分析中重要的库之一: Numpy(numerical python) 看看它在pypi上的说明(理解
        阅读全文
 
摘要:import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline [/code] //anaconda/lib/python2.7/site-packages/matplotlib/fo
        阅读全文
 
摘要:WGS(Whole Genome Sequencing) 指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变。 对于人类来说,全基因组测序的价值是极大的,它的信息包含了所有基因和生命特征之间的内在关联性,当然也意味着更大的数据解读和更高的技术挑战。 测
        阅读全文
 
摘要:《数据分析实战》–用R做聚类分析 本文参考的是 《数据分析实战》 的第八章。 背景: 针对某公司的产品,现目前需要服务好已有的用户,针对不同的用户群体设计并推广不同的营销策略。 现状: 目标用户不明确。 预期: 明确目标用户群。 读取数据 读取Dau数据: > dau <- read.csv('da
        阅读全文
 
摘要:【赋值栅格】工具:此处仅设置【忽略背景值】为黑边像元值,而不设置NoData值,避免所有指定像素将在输出栅格数据集中被设置为 NoData。 忽略背景值: 1、 使用此选项移除在栅格数据周围创建的不需要的值 。指定的值与栅格数据集中的其他有用数据不同。例如,栅格边界上为零的值不同于栅格数据集内的零值
        阅读全文
 
摘要:因为自己准备的时候战战兢兢,所以希望给学弟学妹一些经验,希望大家都万事胜意o( ̄▽ ̄)ブ 不知道这算不算侵字节爸爸的权啊,是的话麻烦提醒一下,我就删了…… 一、准备 岗位描述: 1、负责分字节跳动旗下国内外产品及业务的数据分析工作; 2、分析各项影响产品提升与增长的因素、各项业务细节,结合业务方向,
        阅读全文
 
摘要:文章目录 * 一、工具库简介 * 1、作用 2、安装 3、统计方法归纳 二、描述性统计分析 * 1、介绍 2、操作 三、直方图 * 1、介绍 2、操作 四、抽样分析 * 1、介绍 2、操作 五、相关分析 * 1、介绍 2、操作 六、回归分析 * 1、介绍 2、操作 * 1)简单线性回归 2)多重线性
        阅读全文
 
 |