摘要: import pandas as pd pd.set_option('display.max_rows',20) # 最大行数pd.set_option('display.min_rows',6) # 最小显示行数pd.set_option('display.max_columns',50) # 最 阅读全文
posted @ 2021-09-25 09:59 chliyiyu 阅读(351) 评论(0) 推荐(0)
摘要: 常用 pip 源地址 豆瓣: https://pypi.doubanio.com/simple/ 清华: https://mirrors.tuna.tsinghua.edu.cn/help/pypi/ 中科大: https://pypi.mirrors.ustc.edu.cn/simple/ 阿里云 阅读全文
posted @ 2020-07-22 23:26 chliyiyu 阅读(96) 评论(0) 推荐(0)
摘要: 《提问的智慧》: https://github.com/ryanhanwu/How-To-Ask-Questions-The-Smart-Way/blob/master/README-zh_CN.md Python 3.7.7 官方文档: https://docs.python.org/zh-cn/ 阅读全文
posted @ 2020-07-22 23:24 chliyiyu 阅读(129) 评论(0) 推荐(0)
摘要: 一.重复值处理:直接删除为主。一般先处理重复行,再处理唯一值列。 以行为单位,查看重复值 df[df.duplicated()] 以行为单位,删除重复值 df.drop_duplicates() 以某列(如ID)为单位,查看重复值 df[df.duplicated('ID')] 以某列(如ID)为单 阅读全文
posted @ 2020-05-26 11:28 chliyiyu 阅读(588) 评论(0) 推荐(0)
摘要: Jupyter Notebook 写分析步骤性较方便,在里面设置可以使用R语言时直接在Anaconda prompt中运行: conda install -c r r-essentials 阅读全文
posted @ 2020-05-23 10:35 chliyiyu 阅读(671) 评论(0) 推荐(0)
摘要: 回归分析是关于因变量和自变量之间相关性的一种研究,因变量呢,我们常记做Y,然后它是我们感兴趣的一个研究的问题,比如说借款人是否坏客户,X是可能对Y有影响的一些自变量。这个设定一方面是基于我们的经验,就是哪一些自变量会对应变量可能有影响,另一方面呢,是基于我们对数据的一种可获取性,就比如说我手上的数据 阅读全文
posted @ 2020-05-08 08:48 chliyiyu 阅读(1097) 评论(0) 推荐(0)
摘要: 模型基本思想 回归分析的英文是regression analysis,它是现在数据分析里面用的最多的方法之一吧,也可以说是非常重要的一种统计思想,大学学习的第一个模型就是回归模型,回归分析是一门特别重要的专业课,所以足见这个方法的重要性。首先回归分析能解决什么问题,在做实际数据分析的时候我们经常会遇 阅读全文
posted @ 2020-05-07 17:22 chliyiyu 阅读(1117) 评论(0) 推荐(0)