01 2024 档案
摘要:数据分析整体思路: 1、确定数据来源是否可靠 很多时候听到核心指标下降,可能是别人(产品、运营)告诉你的。第一步先不要慌,先确实数据的来源,是从哪里看到的,数字是否可靠,因为很多人没有数据集散思维,可能断章取义,拿个数字过来 2、确定指标的计算口径是否一致 确定指标的计算口径跟自己理解的是否一致 3
阅读全文
摘要:1、Hadoop是什么? Hadoop是一个由Apache基金会所研发的分布式系统基础架构。主要解决海量数据存储和海量数据的分析计算问题。 2、Hadoop的特点? (1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。 (2)高扩展
阅读全文
摘要:1、什么是Hive? Hive是基于Hadoop的一个数据仓库工具,它提供了类似SQL的查询语言来进行大规模的数据分析和处理。Hive将结构化的数据映射到Hadoop分布式文件系统(HDFS)上,并通过MapReduce任务执行查询操作。 2、数据模型有哪些? 星形模式(Star Schema):星
阅读全文
摘要:已知用户浏览商品的浏览日志表(visit_table): 求2月份每个商品浏览次数Top 3。 select name ,userid ,visit_cnt from ( select * ,row_number(position by name order by visit_cnt desc) a
阅读全文
摘要:已知某款应用的用户登录日志表(login_table): 求此应用2月份用户的次留,3日、7日用户留存率。 select user_login_date ,retained_1_uv / retained_uv as retained_1_ctr --次留率 ,retained_3_uv / ret
阅读全文

浙公网安备 33010602011771号