文章分类 - 数据分析
100道练习题,带你玩转Numpy
摘要:Numpy仍然是Python做数据分析所必须要掌握的基础库之一,以下题是github上的开源项目,主要为了检测你的Numpy能力,同时对你的学习作为一个补充。 1. 导入numpy库并取别名为np (★☆☆) (提示: import … as …) import numpy as np 2. 打印输
阅读全文
NumPy高效使用的5个Tricks
摘要:在 reshape 函数中使用参数-1 Numpy 允许我们根据给定的新形状重塑矩阵,新形状应该和原形状兼容。有意思的是,我们可以将新形状中的一个参数赋值为-1。这仅仅表明它是一个未知的维度,我们希望 Numpy 来算出这个未知的维度应该是多少:Numpy 将通过查看数组的长度和剩余维度来确保它满足
阅读全文
机器学习之K-近邻算法(KNN)
摘要:K-近邻算法(KNN) 引入 如何进行电影分类 众所周知,电影可以按照题材分类,然而题材本身是如何定义的?由谁来判定某部电影属于哪 个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影分类时必须要考虑的问 题。没有哪个电影人会说自己制作的电影和以前的某部电影类似,但我们确实知道每部电影
阅读全文
数据分析之tushare模块
摘要:目录: TuShare简介和环境安装 TuShare的应用 一.TuShare简介和环境安装 TuShare是一个著名的免费、开源的python财经数据接口包。其官网主页为:TuShare -财经数据接口包。该接口包如今提供了大量的金融数据,涵盖了股票、基本面、宏观、新闻等诸多类别数据(具体请自行查
阅读全文
数据分析之matplotlib
摘要:目录: 一、Matplotlib基础知识 1. 包含单条曲线的图 2. 包含多个曲线的图 3. 将多个曲线图绘制在一个table区域中:对象形式创建表图 4. 网格线 plt.grid(XXX) 5. 坐标轴界限 6. 坐标轴标签 7. 图例(legend方法) 二、保存图片 三、2D图形 1. 直
阅读全文
数据分析之pandas
摘要:目录: 一、Pandas的数据结构 (一)Series 1. Series的创建 2. Series的索引和切片 3. Series的基本概念 4. Series的运算 (二)DataFrame 1. DataFrame的创建 2. DataFrame属性:values、columns、index、
阅读全文
数据分析之numpy
摘要:目录: 一、创建ndarray 二、ndarray的属性 三、ndarray的基本操作 四、ndarray的聚合操作 五、ndarray的排序 数据分析:是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析三剑客:Numpy,Pandas,Matplotlib N
阅读全文
浙公网安备 33010602011771号