摘要: Numpy常用方法指南 Numpy是Python数据科学的基石。Pandas、SciPy、Scikit-learn等顶级库都建立在Numpy之上。它提供了高性能的多维数组对象和丰富的数学函数,是数据处理、特征工程、模型输入的必备工具。 创建数组(array creation) import nump 阅读全文
posted @ 2026-06-10 23:04 稀碎, 阅读(3) 评论(0) 推荐(0)
摘要: 列表(list) 特点:有序、可变、元素可重复;使用[]定义,元素用逗号分隔;支持索引、切片、增删改查。 常用操作 # 创建 lst = [1,2,3,'hello',3.14] # 访问 print(lst[0]) # 1 print(lst[-1]) # 3.14 print(lst[1:3]) 阅读全文
posted @ 2026-06-10 14:49 稀碎, 阅读(3) 评论(0) 推荐(0)
摘要: 用敏捷思维做数据 作为一名数据分析师,你是否有过花两周做了一个完美的数据看板,业务方看了一眼说“这不是我要的”;需求一直在变,SQL一直在改,最后不知道哪段代码是最终版本;数据分析报告写的越来越长,决策迟迟不能落地。 今天咱们来聊聊可能改变你工作方式的思维——敏捷思维 更多人觉得“敏捷”是程序员专属 阅读全文
posted @ 2026-06-10 11:45 稀碎, 阅读(7) 评论(0) 推荐(0)
摘要: RFM模型在业务上的帮助 ​ 可以快速识别“高价值用户”,通过R、F、M、三维组合,精准定位20%贡献80%利润的核心用户;实现低成本精准营销,对不同分层用户采取不同策略,如高价值用户做权益维护,沉睡用户发召回券,对高频用户推套餐;预警用户流失风险,R值显著下降(如原本高频用户近一月未购买)会自动标 阅读全文
posted @ 2026-06-09 17:17 稀碎, 阅读(6) 评论(0) 推荐(0)
摘要: 什么是ETL? ETL就是用来解决这些问题的,是将业务数据经抽取(Extract)、转换(Transform)加载(Load)到目标系统(如数仓,数据湖),并让数据规范、统一、好用。在数据分析和业务处理过程中,ETL的工作量往往占整个数据挖掘工作的60%以上,是数据分析过程的核心环节。 本文包含了E 阅读全文
posted @ 2026-06-08 16:45 稀碎, 阅读(8) 评论(0) 推荐(1)