Python 数据分析与应用:从数据获取到可视化---黑马程序员---复习书
第一章:数据分析概述
数据分析是用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。
数据分析的基本过程:明确目的和思路、数据收集、数据处理、数据分析、数据展现。
数据分析的优点:1.语法简单精炼,适合初学者入门;2.拥有一个巨大且活跃的科学计算社区;3.拥有强大的通用编程能力;4.人工智能时代的通用语言;5方便对接其它语言.
数据分析的目的是将隐藏在一大批看似杂乱无章的数据信息中的有用数据集提取出来。
数据处理用于搭建数据仓库,保证数据质量。
Anaconda是完全开源免费,众多平台支持。
Anaconda组件Jupyter Notebook 可以编辑文档展示数据分析的过程。
Matplotlib用于绘制2D图形。
conda list 查看包信息
conda search 查找包
conda install 安装包
conda remove 卸载包
conda update 更新包
第二章:科学计算Numpy库
矢量化运算:NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作的过程。
NumPy 是一个运行速度非常快的数学库,有一个强大的N维数组对象 ndarray用于数组计算。
| 属性 | 说明 |
|---|---|
| ndarray.ndim | 秩,即轴的数量或维度的数量 |
| ndarray.shape | 数组的维度,对于矩阵,n 行 m 列 |
| ndarray.size | 数组元素的总个数,相当于 .shape 中 n*m 的值 |
| ndarray.dtype | ndarray 对象的元素类型 |
| ndarray.itemsize | ndarray 对象中每个元素的大小,以字节为单位 |
| ndarray.flags | ndarray 对象的内存信息 |
| ndarray.real | ndarray元素的实部 |
| ndarray.imag | ndarray 元素的虚部 |
| ndarray.data | 包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。 |
学习链接:https://www.runoob.com/numpy/numpy-tutorial.html
浙公网安备 33010602011771号