随笔分类 - python &&数据分析
摘要:链接:http://www.cs.waikato.ac.nz/ml/weka/index.html 一简介: WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5046450.html 对数据进行分组并对各组应用一个函数,是数据分析的重要环节。数据准备好之后,通常的任务就是计算分组统计或生成透视表。groupby函数能高效处理数据,对数据进行切片、切块、摘要等操作。可以看出这跟SQL关系
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5025772.html python有许多可视化工具,本书主要讲解matplotlib。matplotlib是用于创建出版质量图表的桌面绘图包(主要是2D方面)。matplotlib的目的是为了构建一个MATLAB式的绘图接口。
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5046433.html 5、示例:usda食品数据库 下面是一个具体的例子,书中最重要的就是例子。 #-*- encoding: utf-8 -*- import numpy as np import pandas as pd
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5040342.html 3、数据转换 介绍完数据的重排之后,下面介绍数据的过滤、清理、以及其他转换工作。 去重 #-*- encoding: utf-8 -*- import numpy as np import pandas
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5023330.html 数据分析和建模的大量编程工作都是在数据准备上的(深表同意):加载、清理、转换以及重塑。pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法,他们能够轻松地将数据规整化为正确的形式
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5021858.html 输入输出一般分为下面几类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据。利用Web API操作网络资源。 1、读写文本格式的数据 自己感觉读写文件有时候“需要运气”,经常需要手工调整。因为其
阅读全文
摘要:http://www.cnblogs.com/chaosimple/p/4153083.html 本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5006274.html pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面
阅读全文
摘要:http://www.cnblogs.com/batteryhp/p/4868348.html 第一章 准备工作 今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行,这是码这本书的原因。首先按照书上说的进行安装,google下载了epd_free-7.3-1-win-
阅读全文
浙公网安备 33010602011771号