06 2016 档案

摘要:2016-6-7:第一次学习。2016-8-24:第二次学习,添加思维导图。pandas 两个主要数据结构:Series 和 DataFrame。(建议引入本地)Series:类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成通过Series 的 values 和 index 属性获取其数组表示形式和索引对象可以为数据指定索引,通过索引的方式选取S... 阅读全文
posted @ 2016-06-07 14:17 woaielf 阅读(13178) 评论(0) 推荐(3)
摘要:2016-6-3:第一次学习。2016-8-23:第二次学习,添加思维导图。数据分析应用关注的重点:用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。常用的数组算法,如排序、唯一化、集合运算等。高效的描述统计和数据聚合/摘要运算。用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。将条件逻辑表述为数组表达式(而不是带有if-elif-else分支的循环)。数据的分组运算(聚合、... 阅读全文
posted @ 2016-06-03 15:50 woaielf 阅读(3579) 评论(0) 推荐(1)
摘要:2016-6-2:第一次学习。2016-8-10:第二次学习,添加思维导图。思维导图概览:“Python数据分析”学习目标:与外界进行交互:读写各种各样的文件格式和数据库。准备:对数据进行清理、修整、整合、规范化、重塑、切片切块、变形等处理以便进行分析。转换:对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。建模和计算:将数据跟统计模型、机器学习算法或其他计算工... 阅读全文
posted @ 2016-06-02 15:20 woaielf 阅读(934) 评论(0) 推荐(0)