08 2018 档案
摘要:作用:crosstab和pivot_table都是做统计分析,类似于excel中的表格形式,通常分为行、列 参数:关键的参数有三个,分别是index,columns,values,其中index相当于是行,columns相当于列,values相当于要做统计的对象 函数:pandas.crosstab
阅读全文
摘要:value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True) 作用:用来统计dataframe中某列有多少个不同的取值,并且每个取值出现的次数,类似SQL中的select score,count(*) as
阅读全文
摘要:作用:在对象中筛选出符合where条件的项 两种用法:
阅读全文
摘要:通过loc,iloc,ix可以实现dataframe的分块,做slice处理常用到,依据是行或列,行和列有两个属性,一个是标签,一个是号。 loc --行标签或列标签进行检索 iloc --行号或列号进行检索 ix --行标签或行号进行检索 他们统一的格式是dataframe.loc[['行标签1'
阅读全文
摘要:功能:split-apply-combine,是分割,应用(count,sum,mean,mean,median),再聚合的应用,类似于sql中的group by 分割:分为分割对象和分割条件,分割对象是需要去统计的值,类似于sql中的count(user_id);分割条件是分割的依据,依据可以有多
阅读全文
摘要:根据变量类型选取变量 用到的函数:dataframe.select_dtypes(include=None,exclude=None) 需要注意的是 选择所有数值型变量用np.number 选择字符型变量用object
阅读全文
摘要:感慨片,可以省略不看 Xgboost的安装为什么不可以像其他模块一样,另人很头大!在网上找了各种教程,安装各种软件,然后各种bug,各种error,坚持到快要放弃的时刻,一个简明的教程突然映入我的眼帘,抱着死马当做活马医的心态试了下,就试了下,然后就TM成功了,一分钟都不到!一分钟都不到!一分钟都不
阅读全文
浙公网安备 33010602011771号