随笔档案「2018年8月」 - mango_lee

python crosstab和pivot_table

摘要：作用：crosstab和pivot_table都是做统计分析，类似于excel中的表格形式，通常分为行、列参数：关键的参数有三个，分别是index,columns,values,其中index相当于是行，columns相当于列，values相当于要做统计的对象函数：pandas.crosstab 阅读全文

posted @ 2018-08-22 10:21 mango_lee 阅读(833) 评论(0) 推荐(0)

python value_counts

摘要：value_counts(normalize=False,sort=True,ascending=False,bins=None,dropna=True) 作用：用来统计dataframe中某列有多少个不同的取值，并且每个取值出现的次数，类似SQL中的select score,count(*) as 阅读全文

posted @ 2018-08-16 18:30 mango_lee 阅读(958) 评论(0) 推荐(0)

python numpy where函数

摘要：作用：在对象中筛选出符合where条件的项两种用法：阅读全文

posted @ 2018-08-15 10:36 mango_lee 阅读(598) 评论(0) 推荐(0)

python loc iloc ix的区别和联系

摘要：通过loc,iloc,ix可以实现dataframe的分块，做slice处理常用到，依据是行或列，行和列有两个属性，一个是标签，一个是号。 loc --行标签或列标签进行检索 iloc --行号或列号进行检索 ix --行标签或行号进行检索他们统一的格式是dataframe.loc[['行标签1' 阅读全文

posted @ 2018-08-15 09:54 mango_lee 阅读(257) 评论(0) 推荐(0)

python dataframe groupby

摘要：功能：split-apply-combine，是分割，应用(count，sum，mean，mean，median)，再聚合的应用，类似于sql中的group by 分割：分为分割对象和分割条件，分割对象是需要去统计的值，类似于sql中的count(user_id)；分割条件是分割的依据，依据可以有多阅读全文

posted @ 2018-08-10 18:25 mango_lee 阅读(281) 评论(0) 推荐(0)

python dataframe根据变量类型选取变量

摘要：根据变量类型选取变量用到的函数：dataframe.select_dtypes(include=None,exclude=None) 需要注意的是选择所有数值型变量用np.number 选择字符型变量用object 阅读全文

posted @ 2018-08-09 18:10 mango_lee 阅读(855) 评论(0) 推荐(0)

史上最简单的Xgboost安装教程 for Python3.7 on Win10！亲测有效！

摘要：感慨片，可以省略不看 Xgboost的安装为什么不可以像其他模块一样，另人很头大！在网上找了各种教程，安装各种软件，然后各种bug，各种error，坚持到快要放弃的时刻，一个简明的教程突然映入我的眼帘，抱着死马当做活马医的心态试了下，就试了下，然后就TM成功了，一分钟都不到！一分钟都不到！一分钟都不阅读全文

posted @ 2018-08-03 17:54 mango_lee 阅读(1108) 评论(0) 推荐(0)

08 2018 档案

公告