2020年3月20日

python数据分析 基础统计学的学习(2)

摘要: 这一篇介绍一些描述性统计的基本情况。 数据处理是描述性统计的第一步,对于搜集的数据,首先应先排序,将其按照一定的顺序整理。操作完成后要进行分组,以被研究事物的本质属性进行分组,分组的标准要明确,不能出现数据的交叉和重叠。 一、次数分布概况 次数分布一般是初步整理好一组数据后,将同一组或同一类观测值的 阅读全文

posted @ 2020-03-20 11:59 张达铃 阅读(657) 评论(0) 推荐(0)

2020年3月19日

python数据分析 基础统计学的学习(1)

摘要: 统计学的问题实质可以分为以下几个层面 (1)描述一件事物基本的性质 (2)比较两个事物间的差异 (3)一件事物两种不同属性之间的相关关系 (4)分析影响事物的变化的因素 (5)取样的方法如何评价并改进 一、描述统计 描述统计主要研究在得到大量数据后如何对数据进行整理,通过少数几个指标对该数据的全貌进 阅读全文

posted @ 2020-03-19 17:30 张达铃 阅读(631) 评论(0) 推荐(0)

2020年3月17日

python数据分析 numpy库的学习(2)

摘要: 这篇介绍对numpy中的数据如何进行具体的数学操作,既包括普通的四则运算,也有通用函数运算,以及一些基本的线性代数操作。 #最基本的数组运算,和标量进行四则运算 arr=np.array([[1,2,3],[4,5,6],[7,8,8]]) '''print(arr*2) print(arr/3) 阅读全文

posted @ 2020-03-17 22:27 张达铃 阅读(169) 评论(0) 推荐(0)

python数据分析 numpy库的学习(1)

摘要: 因为pandas的后续深入数学计算一定要用到numpy的各种数学表达式,所以接下来就开始深入介绍numpy的数据结构、基本操作以及numpy的常用数学公式和线性代数操作。这一篇先讲python数组整体的操作,不涉及对单个数据的操作。 numpy是python种用于科学计算的基础第三方库,其核心数据结 阅读全文

posted @ 2020-03-17 17:23 张达铃 阅读(204) 评论(0) 推荐(0)

2020年3月16日

python数据分析 pandas库的学习(3)

摘要: 这一篇主要介绍怎么用read_csv方法读取文件并对文件进行初步的评估。 import pandas as pd import numpy as np '''这里主要讲pandas如何导入数据并对数据做最基本的操作和处理 pandas导入数据的方法主要有两种,一个是read_csv,另一个是read 阅读全文

posted @ 2020-03-16 23:26 张达铃 阅读(216) 评论(0) 推荐(0)

python数据分析 pandas库的学习(2)

摘要: dataframe类型是pandas的主要数据类型,其性质见下方1.dataframe是由多种数据类型构成的二维表,由行索引、列索引和值组成。2.dataframe的每一行可以由不同结构数据组成,但每一列的数据必须是同结构。3.和series一样,找不到输入的数据就会用NAN(not a numbe 阅读全文

posted @ 2020-03-16 19:57 张达铃 阅读(139) 评论(0) 推荐(0)

python数据分析 pandas库的学习(1)

摘要: 今天主要学习series这种数据结构。 python的常用数据结构分为series和Dataframe,前者形式类似于带标签的一维向量,后者形式则是带有横纵标签的表格。''' 先按条目讲述series1.series由value和index构成,一个是值一个是索引,其中的数据是numpy数组的arr 阅读全文

posted @ 2020-03-16 19:55 张达铃 阅读(150) 评论(0) 推荐(0)

导航