07 2017 档案
摘要:重新索引 (1)reindex重新索引,在已有的索引基础上新建索引,fill_value可以指定新建索引默认值 (2)#新建索引,如果新建的索引值为空自动填充之前的值 对于DataFrame重新索引同样适用 注意:重新索引的结果类似于一个拷贝动作,这里对df的第一行第一列数据进行重新赋值,但df2并
阅读全文
摘要:Series Series是一维带标签的数组,数组里可以放任意的数据(整数、浮点数、字符串、python Object)等等 创建函数: (1)s = pd.Series(data,index=index),其中index是一个列表,用来作为数据的标签,如果不指定索引,pandas自动分配整形的索引
阅读全文
摘要:知识点: 逻辑斯蒂回归分类器 训练数据集:https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data 数据预处理 打开ipython网页解
阅读全文
摘要:下载数据包 链接:https://grouplens.org/datasets/movielens/1m/ 解压: 四个文件分别是数据介绍,电影数据表,电影评分表,用户表 进行电影数据分析 进入ipython,新建一个项目 从用户表读取用户信息 警告原因,C语言实现的引擎不支持某些特性,最终用Pyt
阅读全文
摘要:ipython notebook 命令行输入ipython notebook 此时,浏览器会自动运行并打开ipython网页 基本操作 如上图所示,新建一个项目 导入相关模块,建立一个数据集 制造数据缺失项,并给新插入部分部分赋值 这样就构造了一个二维的DataFrame数组,其中包含了一些空数据
阅读全文
摘要:1.相关库导入 2.创建数据结构 pandas 有两个重要的数据结构: Series 和 DataFrame 创建Series数组,代表一行或一列 创建DataFrame ,代表二维数组 第一种方式: 第二种方式: 3.查看数据 (1).head() 默认返回前五行的数据,括号里加参数可指定返回前几
阅读全文
摘要:Numpy NumPy系统是Python的一种开源的数组计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。 Numpy常用操作 创建数组 创建1维数组: 查看数组维度 查看
阅读全文
摘要:pandas介绍 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函
阅读全文

浙公网安备 33010602011771号