Python小贴士 - 随笔分类 - Shilo

python 连接数据库

摘要：#### 远程oracle import cx_Oracle conn = cx_Oracle.connect('userid/key@ip:端口号/service_name') cursor = conn.cursor() result = cursor.execute('select * fro 阅读全文

posted @ 2021-11-29 16:26 Shilo 阅读(61) 评论(0) 推荐(0)

python DataFrame将某一列的格式转换为指定格式

摘要：d[d.columns[0]]=d[d.columns[0]].astype('float64') #第1列换成浮点型阅读全文

posted @ 2021-07-28 10:32 Shilo 阅读(2676) 评论(0) 推荐(0)

python DataFrame 列的重命名

摘要：data.columns = [re_colname] 比如 data.columns = ['一个列名'] data.columns = [['两个列名1','两个列名2']] 阅读全文

posted @ 2021-07-28 10:31 Shilo 阅读(1761) 评论(0) 推荐(0)

python 删除list里面的空字符

摘要：dat_lst=list(filter(None, dat_lst)) # 如果是listoflist就要多嵌套一层循环阅读全文

posted @ 2021-07-28 10:29 Shilo 阅读(117) 评论(0) 推荐(0)

python 将DataFrame转换为list

摘要：dat_lst=dat.iloc[:,1:].values.tolist() 阅读全文

posted @ 2021-07-28 10:28 Shilo 阅读(378) 评论(0) 推荐(0)

python DataFrame 简单行拼接列拼接

摘要：分别对df的行或者列进行处理后，会遇到想要把拆开的数据重新拼起来的情况这些数据具有相同的结构，只是单纯的要拼到一起，不涉及连接的关联变量。（就是R的rbind 和 cbind）df= a.append([b,c,d,e,f,g,h,i,j,k,l,m], ignore_index=False) 阅读全文

posted @ 2021-07-28 10:27 Shilo 阅读(4129) 评论(0) 推荐(0)

python DataFrame 重置INDEX

摘要：DataFrame删除某些列后会出现INDEX不连续的问题，会影响循环的运行因此会常用到将INDEX重置为从0到n df.reset_index(drop=True, inplace=True) 阅读全文

posted @ 2021-07-28 10:19 Shilo 阅读(2372) 评论(0) 推荐(0)

python dataframe 读取excel

摘要：# 使用预设数据格式使读取更快,converters={"COLlv1":str,"COLlv2":str,"COLlv3:str"} # 可加入参数限制读取的行数，nrows =10000 d1 = pd.read_excel("D:/data/data.xlsx", encoding="gbk" 阅读全文

posted @ 2021-07-28 10:17 Shilo 阅读(992) 评论(0) 推荐(0)

python dataframe 删掉某几列

摘要：dat = dat.drop(['a','b','c','d','e','f'],axis=1) 阅读全文

posted @ 2021-07-28 10:16 Shilo 阅读(680) 评论(0) 推荐(0)

python DataFrame 去掉重复行

摘要：dat = DataFrame.drop_duplicates(dat,keep='first',inplace=False) 阅读全文

posted @ 2021-07-28 10:15 Shilo 阅读(263) 评论(0) 推荐(0)

python DataFrame 读取excel文件的前n行

摘要：def read_head_xls(file,nrow): ''' 读取nrow行excel数据,并计算耗时用于读取测试数据依赖于 from time import time from xlrd import open_workbook from pandas import DataFrame 阅读全文

posted @ 2021-07-28 10:13 Shilo 阅读(1606) 评论(0) 推荐(0)

python 计算程序运行时长

摘要：计算程序运行的时间，验证优化的效果。 ①依赖于time from time import time ②在程序开始前记录当前系统时间（后面接程序运行代码） t_start=time() ③在程序结束后记录当前系统时间（前面完成了程序的运行） t_end=time() ④计算时长打印时长删除相关阅读全文

posted @ 2021-07-28 10:07 Shilo 阅读(2161) 评论(0) 推荐(0)

python DataFrame数据情况检查函数（列名、类型、非空行数、缺失比例、取值个数）

摘要：def summary(dat): ''' 求一个df的列名、每列数据类型、每列非空行数、每列缺失比例、每列取值个数用于了解原始数据情况 *依赖于 singe_df() from pandas import concat ''' dat_head = singe_df(dat.columns,'c 阅读全文

posted @ 2021-07-28 09:50 Shilo 阅读(678) 评论(0) 推荐(0)

python DataFrame数据格式常用操作(备份)

摘要：啊 # 读取前 import pandas as pd # 读取时 a=pd.read_csv("d:/data/111.csv",encoding="GBK")#读gbk编码文件 b=pd.read_csv("d:/data/222.csv")#读utf8的csv文件 c = pd.read_cs 阅读全文

posted @ 2021-05-09 16:50 Shilo 阅读(423) 评论(0) 推荐(0)

python 异常值处理-替换为值

摘要：在处理数据用于建模的时候，遇到了长尾数据，需要处理异常值，于是参考网上的资料，重新写了函数。是把一个DataFrame的某列超过预计范围（IQR方法）的数据重新赋值为上、下限的方法，如果要删除异常值，需要修改后面几个。 1 import pandas as pd 2 3 def outliners 阅读全文

posted @ 2020-11-18 10:31 Shilo 阅读(3452) 评论(0) 推荐(0)

python 读取RData

摘要：读取Rdata pip install pyreadr import pyreadr result = pyreadr.read_r('/your.Rdata') print(result.keys()) #输出数据名 df=result['sel']) #sel为输出的数据名，数据格式为dataf 阅读全文

posted @ 2020-06-19 10:28 Shilo 阅读(4065) 评论(0) 推荐(0)

python 按照分类变量切割数据

摘要：1 i_week=data_365['星期'].unique() 2 for temp1 in i_week: 3 temp_data=width_365[data_365['星期'].isin([temp1])] 4 exec("df%s = temp_data"%temp1) 5 del tem 阅读全文

posted @ 2020-04-13 16:01 Shilo 阅读(809) 评论(0) 推荐(0)

python 分组统计

摘要：import pandas as pd data1_group=data1['count_num'].groupby(data1['i_week']) i2=data1_group.mean() print(pd.DataFrame(i2)) print(data1_group.size()) pr 阅读全文

posted @ 2020-04-13 15:58 Shilo 阅读(3657) 评论(0) 推荐(0)

用python计算连续高温天数

摘要：留存备份。简单背景：因为想要计算连续高温天数又恰好想用python所以试了试居然能行而且快数据说明：数据集名称 data 行为日期，按升序排列第3列为当日最高气温第8列为需要计算的连续高温天数理论上高温是指35度以上因为地理原因调整为30度前10行的连续高温天数我自己打上去了嫌麻阅读全文

posted @ 2020-03-25 17:18 Shilo 阅读(2029) 评论(0) 推荐(0)

python基本数据操作代码备份

摘要：1 # -*- coding: utf-8 -*- 2 """ 3 Spyder Editor 4 本文件自用 5 是数据处理的基本过程语句 6 包括文件读取、缺失值的识别和处理、异常值识别、重复值删除、数据拼接、列联表操作等 7 """ 8 %pwd 9 #读取csv文件 10 import pa 阅读全文

posted @ 2019-11-05 16:32 Shilo 阅读(338) 评论(0) 推荐(0)

实用主义

能起作用的代码都是好代码

随笔分类 - Python小贴士