2021 年 9月 8 日随笔档案 - 祥瑞哈哈哈

2021年9月8日

摘要：代码: k='22 years' print(k.split()) 输出为: 将字符串通过空格分成多个字符串。 print(k.split()[0])//选取列表字符串的第一个值 print(type(k.split()[0]))//输出该字符串类型 print(np.int8(k.split()[ 阅读全文

posted @ 2021-09-08 21:48 祥瑞哈哈哈阅读(503) 评论(0) 推荐(0)

value_count().sort_index()

摘要：数据集: train=pd.read_csv('./1.csv')//读取内容 print(train['q'].value_counts(dropna=False))//dropna参数代表是否要舍弃Nan，False表示不舍弃输出值: 输出时将该列相同值出现的次数进行统计，按出现的次数由高到低阅读全文

posted @ 2021-09-08 21:35 祥瑞哈哈哈阅读(646) 评论(0) 推荐(0)

循环读取俩个数据集

摘要：数据集: 代码：查看其输出: 第一次输出: 第二次输出: 阅读全文

posted @ 2021-09-08 21:23 祥瑞哈哈哈阅读(54) 评论(0) 推荐(0)

处理数据中的缺失值

摘要：数据集: train=pd.read_csv('./1.csv')//用代码读取数据 print(train)//并对其输出输出结果: id sd q0 NaN 7.0 1.01 NaN NaN NaN2 NaN 4.0 7.03 4.0 NaN 6.04 NaN 6.0 11.05 2.0 Na 阅读全文

posted @ 2021-09-08 20:43 祥瑞哈哈哈阅读(457) 评论(0) 推荐(0)

pandas查看每列的数据类型

摘要：数据集: 代码: train=pd.read_csv('./1.csv') print(train.info()) 输出: id一列均为整数所以它的类型为int64 w一列均为字符所以它的类型为object e一列含有整数和字符类型为object f一列含有整数和浮点数类型为float k一列含有浮阅读全文

posted @ 2021-09-08 17:50 祥瑞哈哈哈阅读(5486) 评论(0) 推荐(0)

pd.pivot_table

摘要： pd.pivot_table 绘制二维表格。数据: 代码: train=pd.read_csv('./1.csv') pivot=pd.pivot_table(train, index=['id'], columns=['sd'], values=['q'], aggfunc=np.sum)//I 阅读全文

posted @ 2021-09-08 13:55 祥瑞哈哈哈阅读(342) 评论(0) 推荐(0)

pandas datatime-datatime会得到什么结果

摘要：数据集:在电脑中/和-区别不大 train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d') startdate =pd.to_datetime('2007-06-01',format='% 阅读全文

posted @ 2021-09-08 13:34 祥瑞哈哈哈阅读(50) 评论(0) 推荐(0)

pd.to_datetime用法

摘要：数据：代码： train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d')//format是输入数据的格式 print(train) 阅读全文

posted @ 2021-09-08 13:29 祥瑞哈哈哈阅读(2598) 评论(0) 推荐(0)

sns.countplot用法

摘要：该函数的作用是画表达一个值数目的直方图。数据展示: train=pd.read_csv('./1.csv')//读取csv文件 plt.figure(figsize=(16,8))//创建大画布 plt.subplot(131)//将大画布分为1一行3列取第一个画布 sns.countplot(x 阅读全文

posted @ 2021-09-08 12:47 祥瑞哈哈哈阅读(1533) 评论(0) 推荐(0)

用group时count和sum

摘要： count和sum的区别 count是计数。 sum是求数值总和。数据集: print(train.groupby(['q'])['sd'].count())//根据q的值进行分组，相同q值放一起，不同q值放不同的地方输出：如图可知统计了q中不同值sd非空的数量。如果改一下数据即count统阅读全文

posted @ 2021-09-08 12:25 祥瑞哈哈哈阅读(401) 评论(0) 推荐(0)

plot参数

摘要： fig, ((ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 6)) data_train.loc[data_train['isDefault'] == 1] \ ['loanAmnt'].apply(np.log) \ .plot(kind='hist', 阅读全文

posted @ 2021-09-08 11:11 祥瑞哈哈哈阅读(387) 评论(0) 推荐(0)

pandas选出满足列条件的行再观察他们的指定列

摘要：数据: 代码: train=pd.read_csv('./1.csv')//读取csv文件 print(train.loc[train['sd']==1])//选出train中满足列'sd'所对应值为1的行数。输出: 在excel中的表格行数仍在系统中保留。 print(train.loc[tra 阅读全文

posted @ 2021-09-08 08:20 祥瑞哈哈哈阅读(172) 评论(0) 推荐(0)

plt.subplots

摘要：该函数返回的是子画布的对象。代码: fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 8))//fig是整体画布，ax1到ax4是子画布对象。 train_loan_fr.groupby('grade')['grade' 阅读全文

posted @ 2021-09-08 08:08 祥瑞哈哈哈阅读(836) 评论(0) 推荐(0)

Series类型变量可以调用plot直接画图。

摘要： Series类型变量可以调用plot直接画图。 ‘barh’ : horizontal bar plot//水平直方图。阅读全文

posted @ 2021-09-08 08:05 祥瑞哈哈哈阅读(117) 评论(0) 推荐(0)

dataframe.groupby('string')['string'].count()

摘要： dataframe.groupby('string')['string'].count()该函数是按'string'的值进行分类，最后计算同类的数目。阅读全文

posted @ 2021-09-08 07:59 祥瑞哈哈哈阅读(120) 评论(0) 推荐(0)

祥瑞哈哈哈

公告