摘要: 代码: k='22 years' print(k.split()) 输出为: 将字符串通过空格分成多个字符串。 print(k.split()[0])//选取列表字符串的第一个值 print(type(k.split()[0]))//输出该字符串类型 print(np.int8(k.split()[ 阅读全文
posted @ 2021-09-08 21:48 祥瑞哈哈哈 阅读(501) 评论(0) 推荐(0)
摘要: 数据集: train=pd.read_csv('./1.csv')//读取内容 print(train['q'].value_counts(dropna=False))//dropna参数代表是否要舍弃Nan,False表示不舍弃 输出值: 输出时将该列相同值出现的次数进行统计,按出现的次数由高到低 阅读全文
posted @ 2021-09-08 21:35 祥瑞哈哈哈 阅读(645) 评论(0) 推荐(0)
摘要: 数据集: 代码: 查看其输出: 第一次输出: 第二次输出: 阅读全文
posted @ 2021-09-08 21:23 祥瑞哈哈哈 阅读(52) 评论(0) 推荐(0)
摘要: 数据集: train=pd.read_csv('./1.csv')//用代码读取数据 print(train)//并对其输出 输出结果: id sd q0 NaN 7.0 1.01 NaN NaN NaN2 NaN 4.0 7.03 4.0 NaN 6.04 NaN 6.0 11.05 2.0 Na 阅读全文
posted @ 2021-09-08 20:43 祥瑞哈哈哈 阅读(444) 评论(0) 推荐(0)
摘要: 数据集: 代码: train=pd.read_csv('./1.csv') print(train.info()) 输出: id一列均为整数所以它的类型为int64 w一列均为字符所以它的类型为object e一列含有整数和字符类型为object f一列含有整数和浮点数类型为float k一列含有浮 阅读全文
posted @ 2021-09-08 17:50 祥瑞哈哈哈 阅读(5476) 评论(0) 推荐(0)
摘要: pd.pivot_table 绘制二维表格。 数据: 代码: train=pd.read_csv('./1.csv') pivot=pd.pivot_table(train, index=['id'], columns=['sd'], values=['q'], aggfunc=np.sum)//I 阅读全文
posted @ 2021-09-08 13:55 祥瑞哈哈哈 阅读(337) 评论(0) 推荐(0)
摘要: 数据集:在电脑中/和-区别不大 train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d') startdate =pd.to_datetime('2007-06-01',format='% 阅读全文
posted @ 2021-09-08 13:34 祥瑞哈哈哈 阅读(45) 评论(0) 推荐(0)
摘要: 数据: 代码: train=pd.read_csv('./1.csv') train['q']= pd.to_datetime(train['q'],format='%Y/%m/%d')//format是输入数据的格式 print(train) 阅读全文
posted @ 2021-09-08 13:29 祥瑞哈哈哈 阅读(2594) 评论(0) 推荐(0)
摘要: 该函数的作用是画表达一个值数目的直方图。 数据展示: train=pd.read_csv('./1.csv')//读取csv文件 plt.figure(figsize=(16,8))//创建大画布 plt.subplot(131)//将大画布分为1一行3列取第一个画布 sns.countplot(x 阅读全文
posted @ 2021-09-08 12:47 祥瑞哈哈哈 阅读(1521) 评论(0) 推荐(0)
摘要: count和sum的区别 count是计数。 sum是求数值总和。 数据集: print(train.groupby(['q'])['sd'].count())//根据q的值进行分组,相同q值放一起,不同q值放不同的地方 输出:如图可知统计了q中不同值sd非空的数量。 如果改一下数据 即count统 阅读全文
posted @ 2021-09-08 12:25 祥瑞哈哈哈 阅读(396) 评论(0) 推荐(0)
摘要: fig, ((ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 6)) data_train.loc[data_train['isDefault'] == 1] \ ['loanAmnt'].apply(np.log) \ .plot(kind='hist', 阅读全文
posted @ 2021-09-08 11:11 祥瑞哈哈哈 阅读(384) 评论(0) 推荐(0)
摘要: 数据: 代码: train=pd.read_csv('./1.csv')//读取csv文件 print(train.loc[train['sd']==1])//选出train中满足列'sd'所对应值为1的行数。 输出: 在excel中的表格行数仍在系统中保留。 print(train.loc[tra 阅读全文
posted @ 2021-09-08 08:20 祥瑞哈哈哈 阅读(172) 评论(0) 推荐(0)
摘要: 该函数返回的是子画布的对象。 代码: fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 8))//fig是整体画布,ax1到ax4是子画布对象。 train_loan_fr.groupby('grade')['grade' 阅读全文
posted @ 2021-09-08 08:08 祥瑞哈哈哈 阅读(834) 评论(0) 推荐(0)
摘要: Series类型变量可以调用plot直接画图。 ‘barh’ : horizontal bar plot//水平直方图。 阅读全文
posted @ 2021-09-08 08:05 祥瑞哈哈哈 阅读(115) 评论(0) 推荐(0)
摘要: dataframe.groupby('string')['string'].count()该函数是按'string'的值进行分类,最后计算同类的数目。 阅读全文
posted @ 2021-09-08 07:59 祥瑞哈哈哈 阅读(117) 评论(0) 推荐(0)