随笔分类 -  python &&数据分析

摘要:链接:http://www.cs.waikato.ac.nz/ml/weka/index.html 一简介: WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任 阅读全文
posted @ 2017-12-04 10:32 贺大卫 阅读(380) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5046450.html 对数据进行分组并对各组应用一个函数,是数据分析的重要环节。数据准备好之后,通常的任务就是计算分组统计或生成透视表。groupby函数能高效处理数据,对数据进行切片、切块、摘要等操作。可以看出这跟SQL关系 阅读全文
posted @ 2017-01-07 16:04 贺大卫 阅读(3910) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5025772.html python有许多可视化工具,本书主要讲解matplotlib。matplotlib是用于创建出版质量图表的桌面绘图包(主要是2D方面)。matplotlib的目的是为了构建一个MATLAB式的绘图接口。 阅读全文
posted @ 2017-01-07 16:03 贺大卫 阅读(16206) 评论(0) 推荐(2)
摘要:http://www.cnblogs.com/batteryhp/p/5046433.html 5、示例:usda食品数据库 下面是一个具体的例子,书中最重要的就是例子。 #-*- encoding: utf-8 -*- import numpy as np import pandas as pd 阅读全文
posted @ 2016-12-29 09:47 贺大卫 阅读(1094) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5040342.html 3、数据转换 介绍完数据的重排之后,下面介绍数据的过滤、清理、以及其他转换工作。 去重 #-*- encoding: utf-8 -*- import numpy as np import pandas 阅读全文
posted @ 2016-12-28 14:46 贺大卫 阅读(4943) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5023330.html 数据分析和建模的大量编程工作都是在数据准备上的(深表同意):加载、清理、转换以及重塑。pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法,他们能够轻松地将数据规整化为正确的形式 阅读全文
posted @ 2016-12-27 16:10 贺大卫 阅读(3359) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5021858.html 输入输出一般分为下面几类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据。利用Web API操作网络资源。 1、读写文本格式的数据 自己感觉读写文件有时候“需要运气”,经常需要手工调整。因为其 阅读全文
posted @ 2016-12-23 09:37 贺大卫 阅读(973) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/chaosimple/p/4153083.html 本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下 阅读全文
posted @ 2016-12-22 14:19 贺大卫 阅读(333) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5006274.html pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成 阅读全文
posted @ 2016-12-19 17:43 贺大卫 阅读(1518) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/5000104.html 第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面 阅读全文
posted @ 2016-12-13 09:50 贺大卫 阅读(631) 评论(0) 推荐(0)
摘要:http://www.cnblogs.com/batteryhp/p/4868348.html 第一章 准备工作 今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行,这是码这本书的原因。首先按照书上说的进行安装,google下载了epd_free-7.3-1-win- 阅读全文
posted @ 2016-12-13 09:48 贺大卫 阅读(1223) 评论(0) 推荐(0)