12 2016 档案
摘要:http://www.cnblogs.com/batteryhp/p/5046433.html 5、示例:usda食品数据库 下面是一个具体的例子,书中最重要的就是例子。 #-*- encoding: utf-8 -*- import numpy as np import pandas as pd
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5040342.html 3、数据转换 介绍完数据的重排之后,下面介绍数据的过滤、清理、以及其他转换工作。 去重 #-*- encoding: utf-8 -*- import numpy as np import pandas
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5023330.html 数据分析和建模的大量编程工作都是在数据准备上的(深表同意):加载、清理、转换以及重塑。pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法,他们能够轻松地将数据规整化为正确的形式
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5021858.html 输入输出一般分为下面几类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据。利用Web API操作网络资源。 1、读写文本格式的数据 自己感觉读写文件有时候“需要运气”,经常需要手工调整。因为其
阅读全文
摘要:http://www.cnblogs.com/chaosimple/p/4153083.html 本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5006274.html pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/4868348.html 第一章 准备工作 今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行,这是码这本书的原因。首先按照书上说的进行安装,google下载了epd_free-7.3-1-win-
阅读全文