摘要:李连江 让每一个文科生都成为统计高手 第一部分:数据与量化:信息点与信息库 P4 统计-由此及彼(样本到总体),分析-从可见到不可见。 样本的属性叫样本统计值(认知手段),总体的属性叫总体参数(认知目的)。 概率样本:总体的每个成员有相同的被抽入样本的概率。 P5 Variable:变项,因人而异的 阅读全文
posted @ 2020-02-27 22:16 罗马尼亚踢车牛 阅读 (24) 评论 (0) 编辑
摘要:图表部分,很多要记忆的。以下来自于培训材料的记录。 但我个人觉得更重要的是要根据业务特点确定用什么样的图表,然后再去查具体的参数,光记住参数意义不是很大。 import numpy as np import pandas as pd import matplotlib.pyplot as plt % 阅读全文
posted @ 2020-02-21 18:56 罗马尼亚踢车牛 阅读 (9) 评论 (0) 编辑
摘要:完成数据清理后,下面通过图表展开对数据的分析。 1.前期初判(分布分析): 1)判断分组区间: # a.散点图:plt.scatter(data[字段1],data['字段2'], s = data[字段3], # 显示大小 c = data[字段4], # 显示颜色 alpha = 0.4, cm 阅读全文
posted @ 2020-02-21 16:34 罗马尼亚踢车牛 阅读 (12) 评论 (0) 编辑
摘要:变量、函数是Python语言的最基本单元,下面是我作为初学者的当前理解,随着学习的深入今后会做刷新。 变量:表示操作对象是谁。 变量的方法:表示能做什么事情。 如何设计变量:先分析需要解决的问题,基于解决问题的逻辑,来设计变量(这块还没深入,等能力提升后再总结)。 变量名称:要有清晰、规范的名称,便 阅读全文
posted @ 2020-02-21 16:11 罗马尼亚踢车牛 阅读 (25) 评论 (0) 编辑
摘要:今天开始在博客园来记录我的学习点滴,这是第一篇《SQL学习笔记》。 一、学习目的:掌握基本的SQL查询功能,重点是groupby、join、子查询、case when、统计函数。 二、学习方式:因为我19年下半年自学过查询语句,现在还是有点印象,所以采用的是通过练题来恢复记忆。 首先在知乎上找到一位 阅读全文
posted @ 2020-02-13 07:59 罗马尼亚踢车牛 阅读 (4) 评论 (0) 编辑