随笔分类 -  大数据分析

摘要:#一、Pandas数据转换函数 map、apply、applymap ●map:只用于Series,实现每个值->值的映射; ●apply:用于Series实现每个值的处理,用于Dataframe实现某个轴的Series的处理; ●applymap:只能用于DataFrame,用于处理该DataFr 阅读全文
posted @ 2020-11-23 15:14 旭东东 阅读(220) 评论(0) 推荐(0)
摘要:#一、Pandas中的表连接Merge语法 ##1.merge的语法 pd.merge(left, right, how="inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort= 阅读全文
posted @ 2020-10-26 09:49 旭东东 阅读(580) 评论(0) 推荐(0)
摘要:#一、什么是Pandas? 一个开源的Python类库:用于数据分析、数据处理、数据可视化 ●高性能 ●容易使用的数据结构 ●容易使用的数据分析工具 很方便和其它类库一起使用: ●numpy: 用于数学计算 ●scikit-learn: 用于机器学习 #二、Pandas数据读取 Pandas需要先读 阅读全文
posted @ 2020-10-14 15:17 旭东东 阅读(390) 评论(0) 推荐(0)
摘要:#一、匿名函数 lambda #二、map函数 ###定义 ●map(方法会将一个函数映射到序列的每一个元素上,生成新序列,包含所有函数返回值。序列里每一个元素都被当做x变量,放到一个函数f(x)里,其结果是f(x1)、f(x2)、f(x3)..... 组成的新序列 #三、reduce函数 ###定 阅读全文
posted @ 2020-09-20 15:07 旭东东 阅读(493) 评论(0) 推荐(0)
摘要:#一、Excel使用场景 #二、Excel的常见函数 ###Excel函数分类 文本清洗类、关联匹配类、逻辑运算类、计算统计类、时间序列类 ##1.常用的文本清洗函数 ###●Find 查找函数与 Left Right 截取函数 ####①使用find和left函数得到最低薪资 找到第一个k的索引 阅读全文
posted @ 2020-09-06 15:48 旭东东 阅读(516) 评论(0) 推荐(0)
摘要:#一、为什么业务重要 ###案例 一家O2O领域的公司,他们的数据分析师发现在重庆地区。线下订单的效率始终提升不上去,在不断对数据分析的过程中,它们研究了配送员的工作状态,路线距离,用户评价,高峰时期订单量等指标,但是始终发现不了问题。后来问了当地的业务员,业务员翻了一个白眼说,重庆是山城啊,送订单 阅读全文
posted @ 2020-08-29 12:50 旭东东 阅读(807) 评论(0) 推荐(0)
摘要:#一、三种核心思维 ##1.结构化 ##2.公式化 ##3.业务化 ###用结构化思考+公式化拆解,获得的最终分析论点。很多时候,是现象。数据是某个结果的体现,但不代表原因。 #二、数据分析思维技巧 ##1.象限法 ##2.多维法 用户统计维度:性别、年龄... 用户行为维度:注册用户、用户偏好、用 阅读全文
posted @ 2020-08-27 22:04 旭东东 阅读(413) 评论(0) 推荐(0)
摘要:#一、网络配置的三种方式 ##1.桥接模式: 1.好处是大家都在同一个网段,互相可以通讯。 2.缺点是,因为IP地址有限,可能会造成IP冲突 ##2.NAT[网络地址转换模式] 1.好处是虚拟机不占用其他的IP,不会造成IP冲突 2.内网的其他人不能和虚拟机通讯 ##3.主机模式 单独的一台电脑 # 阅读全文
posted @ 2020-07-31 10:44 旭东东 阅读(1274) 评论(0) 推荐(0)