2019 年 11月 9 日随笔档案 - 火龙果果儿

python学习笔记4_数据清洗与准备

摘要：一、处理缺失值 pandas使用浮点值NaN（Not a Number）来显示缺失值，并将缺失值称为NA(not available(不可用))。 NA常用处理方法： dropna:根据每个标签的值是否是缺失数据来筛选轴标签，并根据允许丢失的数据量来确定阈值。 fillna:用某些值填充的数据或使用阅读全文

posted @ 2019-11-09 17:35 火龙果果儿阅读(355) 评论(0) 推荐(0)

python学习笔记3.3_json解析

摘要：一、json文件读取源文件：exampl.json 二、json在线解析常用网站：https://www.json.cn/ 三、数据导出为json格式文件阅读全文

posted @ 2019-11-09 13:54 火龙果果儿阅读(168) 评论(0) 推荐(0)

python学习笔记3.2_数据导出

摘要：一、data.to_csv:数据导出 1、to_csv:将数据导出为逗号分隔的文件 2、输出为其他分隔符的文件写入到控制台，并打印：sys.stdout na_rep:对空值进行标注二、series也可以数据导出三、使用分隔格式阅读全文

posted @ 2019-11-09 13:25 火龙果果儿阅读(605) 评论(0) 推荐(0)

python学习笔记3.1_数据读取常用函数参数

摘要：一、read_table/read_csv常用函数参数 1、path:表明文件系统位置的字符串、url或文件型对象 2、sep或delimiter:用于分隔每行字段的字符序列或正则表达式 3、header:用作列名的行号，默认是0（第一行），如果没有列名的话，应该指定为None 4、names:结果阅读全文

posted @ 2019-11-09 11:44 火龙果果儿阅读(299) 评论(0) 推荐(0)

mysql索引优化及explain关键字段解释

摘要： sql优化最低标准： 1、不超过6层嵌套 2、每个嵌套内不超过3个join 3、最大检索行数不超过10亿行一、explain关键字解释 1、id MySQL QueryOptimizer 选定的执行计划中查询的序列号,表示查询中执行select 子句或操作表的顺序。id 值越大优先级越高,越先被阅读全文

posted @ 2019-11-09 10:34 火龙果果儿阅读(1015) 评论(0) 推荐(0)

linux常用命令1:查看内存使用情况

摘要： 1、查看自动任务：crontab -l 2、查看linux内存使用情况查看当前目录磁盘使用情况：df -h 查看当前目录下各文件内存占用情况：du -sh *(或du -sh查看当前目录的总内存占用情况) 阅读全文

posted @ 2019-11-09 10:30 火龙果果儿阅读(846) 评论(0) 推荐(0)