摘要:
常规数据指标的监测,不在话下。如用户量,新用户量,UGC量(社交产品),销量,付费量,推广期间的各种数据等等。这些是最基础也是最基本,同时也是boss们最关注的指标。你接手这项工作的时候第一任务就是把这些数据梳理好。 渠道分析,或者说流量分析。对于一个在上升期得APP来说,你们会花资源去引流量、去别 阅读全文
posted @ 2021-06-25 19:22
BabyGo000
阅读(307)
评论(0)
推荐(0)
摘要:
数据分析工具这么多,应该用哪个来做分析? 这是很多人在做数据分析的时候,经常会碰到一个问题。尤其是新人刚入门的时候,看到下面的数据分析工具 Excel、sql、spss、python、tableau、powerbi、finebi、R、Hadoop、spark…… 可能头都大了,以为这些全部都要学。 阅读全文
posted @ 2021-06-25 19:21
BabyGo000
阅读(740)
评论(0)
推荐(0)
摘要:
2020中国高校计算机大赛·华为云大数据挑战赛-数据分析(二) 哈喽,小伙伴们好久不见,这几个星期由于个人原因,都没时间做比赛,直到最近几天开始做了下,趁周日写下分享记录,分数虽然不高,但是分享出来一些清洗数据和特征工程的看法,希望对大家有所帮助和启发。 这里继续上次的分析,上一篇我们主要分析了数据 阅读全文
posted @ 2021-06-25 19:15
BabyGo000
阅读(346)
评论(0)
推荐(0)
摘要:
**** **前言** 19届同学反馈,拼夕夕的数据分析SQL部分出的很好,20届感叹道,说的太对了。 拼夕夕的笔试题一共五道,考试时只划分为一个部分,答题时间90分钟。 
评论(0)
推荐(0)
摘要:
注:数据分析主要侧重产品sence与Hive使用,也会有少量数据结构、大数据架构与算法相关内容(会放至其它相应篇中)。以下试题为作者面试过程中被经常问到以及日常整理的通用高频面经,包含题目,答案与参考文章,欢迎纠正与补充。 其他相应高频面试题可参考如下内容: 2020 BAT大厂数据挖掘面试经验:“ 阅读全文
posted @ 2021-06-25 18:24
BabyGo000
阅读(265)
评论(0)
推荐(0)
摘要:
一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。 Grubbs’ test(是以Frank E. Grubbs命名的),又叫maximu 阅读全文
posted @ 2021-06-25 18:23
BabyGo000
阅读(164)
评论(0)
推荐(0)
摘要:
招聘爬虫+数据分析 1.爬虫: 采用Scrapy 分布式爬虫技术,使用mongodb作为数据存储,爬取的网站Demo为51job,数据我目前爬了有几千条2.数据处理: 采用pandas对爬取的数据进行清晰和处理 2.数据分析:采用flask后端获取mongodb数据,前端使用bootstrap3.e 阅读全文
posted @ 2021-06-25 18:22
BabyGo000
阅读(441)
评论(0)
推荐(0)
摘要:
1.用python制作炫酷的滚动地球 https://mp.weixin.qq.com/s/mTBhLsO6IuU7l4rme1G1yw 2.python数据分析——pyecharts柱状图全解(小白必看) https://mp.weixin.qq.com/s/fvenxqQBIh-UaYVTJVA 阅读全文
posted @ 2021-06-25 18:20
BabyGo000
阅读(3561)
评论(0)
推荐(1)
摘要:
相关性分析研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。 如:身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。 相关性种类 客 阅读全文
posted @ 2021-06-25 17:26
BabyGo000
阅读(878)
评论(0)
推荐(0)
摘要:
经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天 数据分析精选 给大家整理了十六种常用的 数据分析方法 ,供大家参考学习。 一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方 阅读全文
posted @ 2021-06-25 17:25
BabyGo000
阅读(1227)
评论(0)
推荐(0)
摘要:
对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个! 项目分为三种类型: 可视化项目 探索性数据分析(EDA)项目 预测建模 可视化项目 最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。 1. 新 阅读全文
posted @ 2021-06-25 17:23
BabyGo000
阅读(1024)
评论(0)
推荐(0)
摘要:
来源:悟空智能科技 转自:上海数据分析 模型分析法就是依据各种成熟的、经过实践论证的管理模型对问题进行分析的方法。 在长时间的企业管理理论研究和实践过程中,将企业经营管理中一些经典的相关关系以一个固定模型的方式描述出来,揭示企业系统内部很多本质性的关系,供企业用来分析自己的经营管理状况,针对企业管理 阅读全文
posted @ 2021-06-25 17:22
BabyGo000
阅读(2339)
评论(0)
推荐(0)
摘要:
在进行数据分析过程中,我们通常需要使用各种模型来证明自己的分析观点,使自己的结论更具备说服力,同时也让自己的论证思路更具备逻辑性和条理性。 今天老李就给罗列了6个常用的数据分析模型,并附上实际的案例讲解以及分析模板,希望能让大家快速掌握这些模型和方法! 话不多说,上干货! 1、RFM模型 RFM 分 阅读全文
posted @ 2021-06-25 17:20
BabyGo000
阅读(948)
评论(0)
推荐(0)
摘要:
(注:以下题目主要来自牛客网等论坛,解答由个人解答,可能会出现错误,并非标准答案,欢迎大家进行讨论) 请说明随机森林较一般决策树稳定的几点原因 1)bagging的方法,多个树投票提高泛化能力 2)bagging中引入随机(参数、样本、特征、空间映射),避免单棵树的过拟合,提高整体泛化能力 什么是聚 阅读全文
posted @ 2021-06-25 17:18
BabyGo000
阅读(408)
评论(0)
推荐(0)
摘要:
数据来源:https://www.kaggle.com/c/bike-sharing-demand 第一步:读取数据 并对数据进行分析 import numpy as np import pandas as pd df_train = pd.read_csv('data/kaggle_bike_co 阅读全文
posted @ 2021-06-25 17:17
BabyGo000
阅读(260)
评论(0)
推荐(0)
摘要:
简单介绍 聚类算法属于无监督学习的一种,而其中KMeans算法是比较常用的聚类算法。 主要思想是: 1、在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中。 2、 所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值)。 3、 阅读全文
posted @ 2021-06-25 17:16
BabyGo000
阅读(1933)
评论(0)
推荐(0)
摘要:
英雄联盟美服10000条排位数据分析 英雄联盟是2009年美国拳头游戏开发一款红蓝双方互相对抗的MOBA游戏,每队有5名队员,通过击杀敌方小兵、推塔、击杀敌方英雄,以最终摧毁敌方主堡作为胜利的游戏。 一、数据来源 本次的数据来源是kaggle。 链接地址: https://www.kaggle.co 阅读全文
posted @ 2021-06-25 17:15
BabyGo000
阅读(628)
评论(1)
推荐(0)
摘要:
文章来源:公众号-智能化IT系统。 回归模型有多种,一般在数据分析中用的比较常用的有线性回归和逻辑回归。其描述的是一组因变量和自变量之间的关系,通过特定的方程来模拟。这么做的目的也是为了预测,但有时也不是全部为了预测,只是为了解释一种现象,因果关系。 还是按照老风格,不说空泛的概念,以实际的案例出发 阅读全文
posted @ 2021-06-25 17:01
BabyGo000
阅读(575)
评论(0)
推荐(0)
摘要:
此次数据分析实践是在这篇论文《基于数据挖掘的图书馆书目推荐服务的研究》的基础上进行实施的,将论文中提到的相关技术及相关知识点进行实践操作,并对相关业务进行逻辑上的分析。 【数据分析】图书馆数据-01建表 【数据分析】图书馆数据-02重命名、索书号、分组 【数据分析】图书馆数据-03直方图展示借书数量 阅读全文
posted @ 2021-06-25 17:00
BabyGo000
阅读(186)
评论(0)
推荐(0)
摘要:
时间序列预测 目录 时间序列预测 1.时间序列介绍 2.原始数据集 3.导入数据 4.检测时间序列的平稳性 5.如何使时间序列平稳 5.1 估计和消除趋势 5.1.1 对数转换 5.1.2 移动平均 5.2 消除趋势和季节性 5.2.1 差异化 5.2.2 分解 6.预测时间序列 6.1 AR Mo 阅读全文
posted @ 2021-06-25 16:57
BabyGo000
阅读(1441)
评论(0)
推荐(0)
浙公网安备 33010602011771号