2023 年 2月随笔档案 - 今天也是开心的一天呀

字符串编码的两种方式--LabelEncoder自动编码或者使用map来进行自定义编码

摘要：https://www.bilibili.com/video/BV1464y1W7Ym?p=99&spm_id_from=pageDriver&vd_source=931b4be15c54813d2ea24f15268b69b3看这个视频有详细解释这里的重点是标签编码器要存起来，一定要训练和测试的阅读全文

posted @ 2023-02-24 23:14 今天也是开心的一天呀阅读(79) 评论(0) 推荐(0)

用pandas 里的value_counts来看某个列一共有几种类型的数据，每个数据有多少个

摘要：df['ASBG03'].value_counts() 阅读全文

posted @ 2023-02-24 23:13 今天也是开心的一天呀阅读(68) 评论(0) 推荐(0)

按性别区分，求男女生的平均成绩

摘要：#画一个按性别分的，男生和女生的平均成绩图print(df.groupby('ITSEX')['avg'].mean()) map1={'Boy':0,'Girl':1}df['ITSEX']=df['ITSEX'].map(map1)#数据处理，男生用1，女生用0df.head()#接下来要打标签阅读全文

posted @ 2023-02-21 22:52 今天也是开心的一天呀阅读(205) 评论(0) 推荐(0)

PIRLS求某列数据的元素个数

摘要：使用unique得到不重复的元素然后使用len求个数阅读全文

posted @ 2023-02-21 20:34 今天也是开心的一天呀阅读(26) 评论(0) 推荐(0)

pandas求列的平均分

摘要：#求平均值 df['avg']=df[['ASRREA01','ASRREA02','ASRREA03','ASRREA04','ASRREA05', 'ASRLIT01','ASRLIT02','ASRLIT03','ASRLIT04','ASRLIT05', 'ASRINF01','ASRINF 阅读全文

posted @ 2023-02-15 03:31 今天也是开心的一天呀阅读(69) 评论(0) 推荐(0)

把数据到处成csv和读入的记录--pandas

摘要：dfavg=df[['IDSTUD','IDSCHOOL','avg']] dfavg.head() #把学号和成绩搞出来，然后输出保存成csv outputpath='dfavg.csv' dfavg.to_csv(outputpath,sep=',',index=False,header=Tru 阅读全文

posted @ 2023-02-15 00:27 今天也是开心的一天呀阅读(30) 评论(0) 推荐(0)

pandas数据处理把BOOKLET11变成11

摘要：def book_map(x): book_map=x[-2:] return book_map df['IDBOOK']=df['IDBOOK'].map(book_map) df.head() #啊啊啊好开心，完美我真棒，自己写出来了通过函数来进行map的方法 #接下来其他的数据处理，需要思考通阅读全文

posted @ 2023-02-14 19:51 今天也是开心的一天呀阅读(21) 评论(0) 推荐(0)

pandas里使用map函数并且是自定义函数来实现规则的方式def

摘要：现在我的问题是，有一堆数据，用一些字符串开头，然后换成数字原本我用的死办法，直接先做字典，然后用字典的内容作为map的映射规则但是由于这些字符太多了，做字典很容易出错，导致映射出来很多NaN值，所以改用了新方法使用函数作为映射规则，而函数再进行判断的时候，可以就用开头的字符串进行判断，准确率提阅读全文

posted @ 2023-02-14 17:56 今天也是开心的一天呀阅读(99) 评论(0) 推荐(0)

pandas dropna无效，没有去空值成功怎么处理？

摘要：df1=dfASH_avg.dropna(axis=0,how='any')#刪除表中任何含有NaN的行 #这里有一个大坑就是意识到dropna的结果是需要用一个新的dataframe借助的 dfASH_avg.head() 阅读全文

posted @ 2023-02-14 16:31 今天也是开心的一天呀阅读(166) 评论(0) 推荐(0)

02 2023 档案

公告