2019年11月9日

python学习笔记4_数据清洗与准备

摘要: 一、处理缺失值 pandas使用浮点值NaN(Not a Number)来显示缺失值,并将缺失值称为NA(not available(不可用))。 NA常用处理方法: dropna:根据每个标签的值是否是缺失数据来筛选轴标签,并根据允许丢失的数据量来确定阈值。 fillna:用某些值填充的数据或使用 阅读全文

posted @ 2019-11-09 17:35 火龙果果儿 阅读(354) 评论(0) 推荐(0)

python学习笔记3.3_json解析

摘要: 一、json文件读取 源文件:exampl.json 二、json在线解析 常用网站:https://www.json.cn/ 三、数据导出为json格式文件 阅读全文

posted @ 2019-11-09 13:54 火龙果果儿 阅读(168) 评论(0) 推荐(0)

python学习笔记3.2_数据导出

摘要: 一、data.to_csv:数据导出 1、to_csv:将数据导出为逗号分隔的文件 2、输出为其他分隔符的文件 写入到控制台,并打印:sys.stdout na_rep:对空值进行标注 二、series也可以数据导出 三、使用分隔格式 阅读全文

posted @ 2019-11-09 13:25 火龙果果儿 阅读(603) 评论(0) 推荐(0)

python学习笔记3.1_数据读取常用函数参数

摘要: 一、read_table/read_csv常用函数参数 1、path:表明文件系统位置的字符串、url或文件型对象 2、sep或delimiter:用于分隔每行字段的字符序列或正则表达式 3、header:用作列名的行号,默认是0(第一行),如果没有列名的话,应该指定为None 4、names:结果 阅读全文

posted @ 2019-11-09 11:44 火龙果果儿 阅读(294) 评论(0) 推荐(0)

mysql索引优化及explain关键字段解释

摘要: sql优化最低标准 : 1、不超过6层嵌套 2、每个嵌套内不超过3个join 3、最大检索行数不超过10亿行 一、explain关键字解释 1、id MySQL QueryOptimizer 选定的执行计划中查询的序列号,表示查询中执行select 子句或操作表的顺序。id 值越大优先级越高,越先被 阅读全文

posted @ 2019-11-09 10:34 火龙果果儿 阅读(1015) 评论(0) 推荐(0)

linux常用命令1:查看内存使用情况

摘要: 1、查看自动任务:crontab -l 2、查看linux内存使用情况 查看当前目录磁盘使用情况:df -h 查看当前目录下各文件内存占用情况:du -sh *(或du -sh查看当前目录的总内存占用情况) 阅读全文

posted @ 2019-11-09 10:30 火龙果果儿 阅读(844) 评论(0) 推荐(0)

导航