摘要: 阅读全文
posted @ 2019-09-28 11:05 lvzw 阅读(3762) 评论(0) 推荐(1)
摘要: 一、数据挖掘流程介绍 1.数据读取 -读取数据 -统计指标 -数据规模 2.数据探索(特征理解) -单特征的分析,诸个变量分析对结果y的影响(x,y的相关性) -多变量分析(x,y之间的相关性) -统计绘图 3.数据清洗和预处理 -缺失值填充 -标准化、归一化 -特征工程(筛选有价值的特征) -分析 阅读全文
posted @ 2019-09-24 13:22 lvzw 阅读(7279) 评论(0) 推荐(0)
摘要: Table of Contents¶ 1 驱虫市场潜力分析 1.1 数据处理 1.1.1 导包 1.1.2 读取数据 1.1.2.1 读取各个子类目交易额数据,合并 1.1.2.2 自定义读取单个xlsx文件的函数 1.1.2.3 读取所有文件到列表 1.1.3 依行索引(时间)将所有文件合并到一个 阅读全文
posted @ 2019-09-20 17:08 lvzw 阅读(717) 评论(0) 推荐(0)
摘要: 一、案例综述 1.数据文件说明 客户相关文件: 1. UserInfo.csv:用户主表 2. RegionInfo.csv:区域表 3. UserAddress.csv:用户地址表 商品相关文件: 1. GoodsInfo.csv:商品主表 2. GoodsBrand.csv:商品品牌表 3. G 阅读全文
posted @ 2019-09-20 09:45 lvzw 阅读(509) 评论(1) 推荐(0)
摘要: TensorFlow Scikit-Learn Numpy Keras PyTorch LightGBM Eli5 SciPy Theano Pandas 简介 python 是最流行和使用最广泛的编程语言之一,它已经取代了业界许多编程语言。 python 在开发人员中流行的原因有很多。然而,最重要 阅读全文
posted @ 2019-09-18 09:05 lvzw 阅读(296) 评论(0) 推荐(0)
摘要: Jupyter笔记本有两种不同的键盘输入模式. 编辑模式允许您将代码或文本输入到一个单元格中,并通过一个绿色的单元格来表示 命令模式将键盘与笔记本级命令绑定在一起,并通过一个灰色的单元格边界显示,该边框为蓝色的左边框。 F : 查找并且替换 Ctrl-Shift-F : 打开命令配置 Ctrl-Sh 阅读全文
posted @ 2019-08-23 18:33 lvzw 阅读(2211) 评论(0) 推荐(0)
摘要: 一、字符串的格式化 1.字符串格式化输出 2.填充与对齐 填充常跟对齐一起使用,^<>分别是居中、左对齐、右对齐,后⾯带宽度 :号后面带填充的字符,只能是一个字符,不指定的话默认是⽤空格填充 # 我想填一个占宽8个位置的,如果不足就⽤空格填充 '{:^8}'.format('2333') # 居中 阅读全文
posted @ 2019-08-23 16:59 lvzw 阅读(495) 评论(0) 推荐(0)
摘要: 问题求解(problem solving):将问题形式化、寻找并表达解决方案的过程。⾼级语言(high-level language):像Python这样被设计成人类容易阅读和编写的编程语言。低级语言(low-level language):被设计成计算机容易运行的编程语⾔,也被称为 ”机器语言“( 阅读全文
posted @ 2019-08-22 21:17 lvzw 阅读(1803) 评论(0) 推荐(0)
摘要: §1 基本思想 主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据进行最佳综合简化。也就是说,对高维变量空间进行降维处理。研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。 §2 数学模型 假设我们所 阅读全文
posted @ 2019-08-18 15:30 lvzw 阅读(1110) 评论(0) 推荐(0)