上一页 1 2 3 4 5 6 7 8 ··· 36 下一页
摘要: 〇、判断数据框中非数值的取值 data.loc[data['score'].apply(lambda x: False if str(x).isdigit() else True), 'score'].values 一、isinstance 判断输入是否为整数或者浮点数,可利用 ininstance 阅读全文
posted @ 2022-08-26 16:10 Hider1214 阅读(3367) 评论(0) 推荐(0) 编辑
摘要: 一、kill -9 pid 结束 Linux 后台进程,使用该命令。 kill -9 pid 实际上 kill -n 传输一个信号编码给到程序,n 有30个可以选择,最常用便是 -9。 二、查看后台进程 ps -ef | grep tomcat ps -ef | grep tomcat | grep 阅读全文
posted @ 2022-08-12 11:19 Hider1214 阅读(858) 评论(0) 推荐(0) 编辑
摘要: 一、os.popen()方法 1.使用语法 os.popen() 方法用于从一个命令打开一个管道。 os.popen(cmd).read() 获取执行后结果。 os.popen(command[, mode[, bufsize]]) # 使用的命令 # 模式权限:默认'r'或者'w' # 文件需要的 阅读全文
posted @ 2022-08-12 11:18 Hider1214 阅读(5565) 评论(0) 推荐(0) 编辑
摘要: 一、删除文件和目录 Python 中利用 os 模块对文件进行操作。 import os path = r'C:\Users\111\Desktop\test' os.chdir(path) os.listdir() file_path = os.path.join(path, '我.txt') # 阅读全文
posted @ 2022-08-08 15:42 Hider1214 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 日常工作中常常需要打印日志,进行查看、调试,有时打印日志很长而长度不一致的话,查阅起来难免没那么直观,遂诞生寻找控制打印长度的函数。例如:ljust、rjust、center等。 一、ljust、rjust、center方法 这3个方法都可以设定对齐长度,填充特定字符。 语法 String.ljus 阅读全文
posted @ 2022-08-08 13:04 Hider1214 阅读(653) 评论(0) 推荐(0) 编辑
摘要: 源于生产上有多个零碎的 HDFS 小文件需要通过 Python 进行读取,遂产生需求。 屡经测试,除去真正 pd.read_csv 读取数据时间无法避免之外,一边读取数据存储为临时变量,一边进行 pd.concat 合并也造成大量开销。 # 读取数据 data = pd.DataFrame() fo 阅读全文
posted @ 2022-08-01 17:22 Hider1214 阅读(1227) 评论(0) 推荐(1) 编辑
摘要: 方法一:as select 直接复制表数据、表字段,但表属性已改变,分区不存在。 **缺点:**分区字段会变成普通列,且无法复制字段的 comment 备注信息。 -- 直接备份 create table if not exists aaa as select * from bbb 方法二:like 阅读全文
posted @ 2022-06-28 10:40 Hider1214 阅读(874) 评论(0) 推荐(0) 编辑
摘要: 一、需求 将字符串(例如:2022-06-02)转换为时间对象类型。 二、实操 1.利用 time.strptime 解析 import time, datetime # 使用 time.strptime 方法解析日期字符串成为时间对象 time_str = '2022-06-02' time_tu 阅读全文
posted @ 2022-06-02 17:39 Hider1214 阅读(701) 评论(0) 推荐(0) 编辑
摘要: 一、需求 因跑模型需要,根据入参,自动设定训练集、测试集、生产集周期。 例如:本月输入“202203”,上月即为“202202”,次月为“202204”。 二、实操 import time, datetime, calendar # 上月 def last_month(month): month = 阅读全文
posted @ 2022-06-02 11:32 Hider1214 阅读(536) 评论(0) 推荐(0) 编辑
摘要: 一、需求 本打算使用 Pandas 中的 describe() 函数查看一些数据的分布情况,显示为科学计数法,不方便对比。 data_train[['hold_day','hold_cnt']].describe() ''' hold_day hold_cnt count 1.492277e+06 阅读全文
posted @ 2022-05-30 12:02 Hider1214 阅读(3864) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 36 下一页