摘要: 本文主要是个人的学习笔记总结,数据预处理的基本思路和方法,包括一些方法的使用示例和参数解释,具体的数据预处理案例case详见其他文章。如有错误之处还请指正! 目录数据的质量评定数据处理步骤缺失值的处理标记缺失值删除缺失值填充缺失值重复值处理异常值的处理数据集合并pandas.DataFrame.co 阅读全文
posted @ 2023-12-14 09:39 Pennaa 阅读(372) 评论(0) 推荐(0) 编辑
摘要: 数据预处理案例1 主要涉及pandas读取csv文件,缺失值和重复值处理,分组计数,字段类型转换 ,结果写入到Excel。 根据要求对CSV数据集进行处理要求如下: 保留数据关键信息:time、latitude、longtitude、depth、mag、region 注意其中的 region 未直接 阅读全文
posted @ 2023-12-07 11:38 Pennaa 阅读(39) 评论(0) 推荐(0) 编辑
摘要: [VBA] 实现 SQLserver数据库的增删改查 问题背景 用于库存管理的简单Excel系统实现,能够让库管员录入每日出入库信息并进能够按日期查询导出数据,生成简要报表,以及数据修改与删除。非科班且对VB语言和数据库语言未系统学习,有一点C语言与Python基础,有不足之处还请指教。 实现过程 阅读全文
posted @ 2023-12-02 15:08 Pennaa 阅读(120) 评论(0) 推荐(0) 编辑
摘要: Pandas 此文稍长,但是包括了pandas的基础入门使用以及一些进阶部分:时间序列,数据清洗预处理等操作,当然要学习了解更多细节和操作去翻阅Pandas官方的操作手册也是必不可少的。 基础部分 导入pandas import pandas as pd 查看版本信息 pd.__version__ 阅读全文
posted @ 2023-11-09 16:41 Pennaa 阅读(42) 评论(0) 推荐(1) 编辑
摘要: 数据采集方法 本文主要是个人学习过程中记录的笔记,此部分内容包括常见的数据文件的存储和读取,通常在使用Python读取数据文件比较推荐Pandas模块,当然在对Excel进行读取和操作时也可以配合openpyxl,xlwings等。由于此前是使用JupyterNotebook进行编写和学习的,如果使 阅读全文
posted @ 2023-10-31 17:46 Pennaa 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 数据库三级第三章知识点总结 阅读全文
posted @ 2023-08-30 10:31 Pennaa 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 数据库三级第二章知识点总结 阅读全文
posted @ 2023-08-30 10:22 Pennaa 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 数据库三级第一章知识点总结 阅读全文
posted @ 2023-08-30 09:58 Pennaa 阅读(12) 评论(0) 推荐(0) 编辑