02 2023 档案
摘要:https://www.bilibili.com/video/BV1464y1W7Ym?p=99&spm_id_from=pageDriver&vd_source=931b4be15c54813d2ea24f15268b69b3看这个视频有详细解释 这里的重点是标签编码器要存起来,一定要训练和测试的
阅读全文
摘要:df['ASBG03'].value_counts()
阅读全文
摘要:#画一个按性别分的,男生和女生的平均成绩图print(df.groupby('ITSEX')['avg'].mean()) map1={'Boy':0,'Girl':1}df['ITSEX']=df['ITSEX'].map(map1)#数据处理,男生用1,女生用0df.head()#接下来要打标签
阅读全文
摘要:使用unique得到不重复的元素 然后使用len求个数
阅读全文
摘要:#求平均值 df['avg']=df[['ASRREA01','ASRREA02','ASRREA03','ASRREA04','ASRREA05', 'ASRLIT01','ASRLIT02','ASRLIT03','ASRLIT04','ASRLIT05', 'ASRINF01','ASRINF
阅读全文
摘要:dfavg=df[['IDSTUD','IDSCHOOL','avg']] dfavg.head() #把学号和成绩搞出来,然后输出保存成csv outputpath='dfavg.csv' dfavg.to_csv(outputpath,sep=',',index=False,header=Tru
阅读全文
摘要:def book_map(x): book_map=x[-2:] return book_map df['IDBOOK']=df['IDBOOK'].map(book_map) df.head() #啊啊啊好开心,完美我真棒,自己写出来了通过函数来进行map的方法 #接下来其他的数据处理,需要思考通
阅读全文
摘要:现在我的问题是,有一堆数据,用一些字符串开头,然后换成数字 原本我用的死办法,直接先做字典,然后用字典的内容作为map的映射规则 但是由于这些字符太多了,做字典很容易出错,导致映射出来很多NaN值,所以改用了新方法 使用函数作为映射规则,而函数再进行判断的时候,可以就用开头的字符串进行判断,准确率提
阅读全文
摘要:df1=dfASH_avg.dropna(axis=0,how='any')#刪除表中任何含有NaN的行 #这里有一个大坑就是意识到dropna的结果是需要用一个新的dataframe借助的 dfASH_avg.head()
阅读全文
浙公网安备 33010602011771号