摘要:随机抽样 (numpy.random) 简单的随机数据 rand(d0, d1, ..., dn) 随机值 >>> np.random.rand(3,2) array([[ 0.14022471, 0.96360618], #random [ 0.37601032, 0.25528411], #ra
阅读全文
随笔分类 - 数据分析,统计
摘要:Enthought Canopy: Easy Python Deployment Plus Integrated Analysis Environment for Scientific Computing, Data Analysis and EngineeringDOWNLOADFREE for ...
阅读全文
摘要:Pandas库之DataFrame 1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可
阅读全文
摘要:random模块用于生成随机数,下面看看模块中一些常用函数的用法: numpy.random.rand(d0, d1, ..., dn):生成一个[0,1)之间的随机浮点数或N维浮点数组。#numpy.random.rand(d0, d1, ..., dn)import numpy as np#无参
阅读全文
摘要:reduce函数:在Python 3里,reduce()函数已经被从全局名字空间里移除了,它现在被放置在fucntools模块里 用的话要 先引入:>>> from functools import reduce >>> print(l1)[0, 1, 2, 3, 4, 5, 6]>>> reduc
阅读全文
摘要:Python在数据科学中的地位,不仅仅是因为numpy, scipy, pandas, scikit-learn这些高效易用、接口统一的科学计算包,其强大的数据可视化工具也是重要组成部分。在Python中,使用的最多的数据可视化工具是matplotlib,除此之外还有很多其他可选的可视化工具包,主要
阅读全文
摘要:摘要:本文解释了回归分析及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种最常用的回归技术及其关键要素,最后介绍了选择正确的回归模型的关键因素。回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌...
阅读全文
摘要:一、《女士品茶》若说到统计学的科普书籍,这本书几乎是所有学过统计的人首推的一本。它不是一本女性读物,也不是一本介绍饮茶文化的书籍。如果只看书名标题,你可能会产生误解,很难将其与统计学联想到一起。不妨看看写在封面最上面那一行的字:“20世纪统计学是加何影响科学革命的",相信这样一个气势宏大的副标题应该...
阅读全文
摘要:如今的移动应用早已不再是某种结构单一、功能简单的工具了。当我们的移动应用变得越来越庞杂,我们便会需要借用分析工具,来跟踪和分析App内的每一个部分。幸运的是,目前市面上有许多数据分析工具可供App开发团队选择。 事实上,这些新一代的数据分析工具,将可以监测发生在App中的每一个细小的事件。如果你曾经...
阅读全文
摘要:python——获取数据类型 在python中,可使用type()和isinstance()内置函数获取数据类型 如: (1)type()的使用方法: >>> a = '230' >>> type(a) <class 'str'> >>> a = 230 >>> type(a) <class 'in
阅读全文
摘要:Pandas pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 >>> from pandas import Seri
阅读全文
摘要:NumPy NumPy是高性能科学计算和数据分析的基础包。部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。 线性代数、随机数生成以及傅里叶变
阅读全文
浙公网安备 33010602011771号