随笔分类 -  数据分析

摘要:df=DataFrame([{‘A’:’11’,’B’:’12’},{‘A’:’111’,’B’:’121’},{‘A’:’1111’,’B’:’1211’}]) 来自:https://blog.csdn.net/u012189747/article/details/78203364?locatio 阅读全文
posted @ 2018-08-15 22:09 静悟生慧 阅读(61694) 评论(0) 推荐(1)
摘要:https://blog.csdn.net/u012884015/article/details/78653178 阅读全文
posted @ 2018-08-14 20:48 静悟生慧 阅读(13883) 评论(0) 推荐(0)
摘要:https://blog.csdn.net/sinat_32502811/article/details/80878146 里面有weapon 大神的git地址 https://blog.csdn.net/francis1019/article/details/81253401 有作者源码:http 阅读全文
posted @ 2018-08-14 18:30 静悟生慧
摘要:df = pd.read_csv('....') 要调用循环处理多个文件时,内存占用情况严重,如果互相之间不需要调用,可以直接del df 释放内存 阅读全文
posted @ 2018-08-14 11:33 静悟生慧 阅读(3369) 评论(0) 推荐(1)
摘要:https://blog.csdn.net/u010900574/article/details/52666291 博主总结和很好,方法很实用。 python一些依赖库: https://www.lfd.uci.edu/~gohlke/pythonlibs/ lightgbm的原理及使用简介:包含建 阅读全文
posted @ 2018-08-12 22:16 静悟生慧 阅读(1041) 评论(0) 推荐(0)
摘要:In [2]: df Out[2]: A B 0 1.068932 -0.794307 2 -0.470056 1.192211 4 -0.284561 0.756029 6 1.037563 -0.267820 8 -0.538478 -0.800654 In [5]: df.iloc[[2]] 阅读全文
posted @ 2018-08-12 20:09 静悟生慧 阅读(461) 评论(0) 推荐(0)
摘要:https://stackoverflow.com/questions/51091132/pandas-and-scikit-learn-keyerror-not-in-index The problem is the way you are trying to index the X using  阅读全文
posted @ 2018-08-10 11:23 静悟生慧 阅读(12024) 评论(0) 推荐(0)
摘要:Xgboost调参: https://wuhuhu800.github.io/2018/02/28/XGboost_param_share/ https://blog.csdn.net/hx2017/article/details/78064362 pandas DataFrame中的空值处理: h 阅读全文
posted @ 2018-08-10 10:43 静悟生慧 阅读(489) 评论(0) 推荐(0)
摘要:用户画像(UserProfile) 也叫用户信息标签化、客户标签;从电商的角度看,根据你在电商网站上所填的信息和你的行为,可以用一些标签把你描绘出来,描述你的标签就是用户画像。 构建用户画像技术 用户画像:基本属性、购买能力、行为特征、社交网络、心理特征、兴趣爱好 行为建模:文本挖掘、自然语言处理、 阅读全文
posted @ 2018-07-26 18:14 静悟生慧 阅读(665) 评论(0) 推荐(0)