随笔分类 -  python

摘要:在进行网络编程之前,先对网络以及互联网协议做一个了解。 推荐阮一峰的博客:(感谢) http://www.ruanyifeng.com/blog/2012/05/internet_protocol_suite_part_i.html --再去看一遍先-- --看完了-- 16.1引言 客户端、服务器 阅读全文
posted @ 2016-02-23 21:16 司空格子Ored 阅读(598) 评论(0) 推荐(1) 编辑
摘要:15.1引言与动机 处理文本和数据是一件大事。正则表达式(RE)为高级文本匹配模式,为搜索-替换等功能提供了基础。RE是由一些字符和特殊符号组成的字符串,它们描述了这些字符和字符串的某种重复方式,因此能按某种模式匹配一个有相似特征的字符串的集合,也就是说,一个只能匹配一个字符串的RE是无聊的。 Py 阅读全文
posted @ 2016-02-13 22:28 司空格子Ored 阅读(683) 评论(0) 推荐(0) 编辑
摘要:3、更多示例应用 本节介绍一些其他的例子。 信号前沿分析 本小节将介绍一种简化的截面动量投资组合,并得出如何得到模型参数化网格。 阅读全文
posted @ 2015-12-21 21:56 司空格子Ored 阅读(1117) 评论(0) 推荐(0) 编辑
摘要:自2005年开始,python在金融行业中的应用越来越多,这主要得益于越来越成熟的函数库(NumPy和pandas)以及大量经验丰富的程序员。许多机构发现python不仅非常适合成为交互式的分析环境,也非常适合开发文件的系统,所需的时间也比Java或C++少得多。Python还是一种非常好的粘合层, 阅读全文
posted @ 2015-12-20 10:46 司空格子Ored 阅读(8858) 评论(0) 推荐(0) 编辑
摘要:7、时间序列绘图 pandas时间序列的绘图功能在日期格式化方面比matplotlib原生的要好。 #-*- coding:utf-8 -*- import numpy as np import pandas as pd import matplotlib.pyplot as plt import 阅读全文
posted @ 2015-12-19 19:59 司空格子Ored 阅读(8135) 评论(2) 推荐(0) 编辑
摘要:5、时期及其算数运算 时期(period)表示的是时间区间,比如数日、数月、数季、数年等。Period类所表示的就是这种数据类型,其构造函数需要用到一个字符串或整数,以及频率。 #-*- coding:utf-8 -*- import numpy as np import pandas as pd 阅读全文
posted @ 2015-12-18 22:50 司空格子Ored 阅读(3320) 评论(0) 推荐(0) 编辑
摘要:时间序列是很重要的。时间序列(time series)数据是一种重要的结构化数据格式。时间序列的意义取决于具体的应用场景,主要有以下几种: 时间戳(timestamp),特定的时刻 固定时期(period),如2015年全年 时间间隔(interval),由起始和结束时间戳表示。就是说,时期可以是时 阅读全文
posted @ 2015-12-17 19:57 司空格子Ored 阅读(16814) 评论(0) 推荐(1) 编辑
摘要:第三节中的四个示例。(ps:新开一篇是为了展现对例子的重视。) 3.1用特定于分组的值填充缺失值 对于缺失值的清理工作,可以用dropna进行删除,有时候需要进行填充(或者平滑化)。这时候用的是fillna。 #-*- encoding:utf-8 -*- import numpy as np im 阅读全文
posted @ 2015-12-15 21:44 司空格子Ored 阅读(2429) 评论(0) 推荐(0) 编辑
摘要:对数据进行分组并对各组应用一个函数,是数据分析的重要环节。数据准备好之后,通常的任务就是计算分组统计或生成透视表。groupby函数能高效处理数据,对数据进行切片、切块、摘要等操作。可以看出这跟SQL关系密切,但是可用的函数有很多。在本章中,可以学到: 根据一个或多个键(可以是函数、数组或DataF 阅读全文
posted @ 2015-12-14 20:22 司空格子Ored 阅读(2213) 评论(0) 推荐(0) 编辑
摘要:5、示例:usda食品数据库下面是一个具体的例子,书中最重要的就是例子。#-*- encoding: utf-8 -*-import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Ser... 阅读全文
posted @ 2015-12-14 20:12 司空格子Ored 阅读(1503) 评论(0) 推荐(0) 编辑
摘要:3、数据转换介绍完数据的重排之后,下面介绍数据的过滤、清理、以及其他转换工作。去重#-*- encoding: utf-8 -*-import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas impor... 阅读全文
posted @ 2015-12-11 21:52 司空格子Ored 阅读(2006) 评论(0) 推荐(0) 编辑
摘要:python有许多可视化工具,本书主要讲解matplotlib。matplotlib是用于创建出版质量图表的桌面绘图包(主要是2D方面)。matplotlib的目的是为了构建一个MATLAB式的绘图接口。本书中的大部分图都是用它生成的。除了图形界面显示,还可以把图片保存为pdf、svg、jpg、pn... 阅读全文
posted @ 2015-12-07 12:49 司空格子Ored 阅读(3614) 评论(3) 推荐(0) 编辑
摘要:数据分析和建模的大量编程工作都是在数据准备上的(深表同意):加载、清理、转换以及重塑。pandas和Python标准库提供了一组高级的、灵活的、高效的核心函数和算法,他们能够轻松地将数据规整化为正确的形式。1、合并数据集pandas对象中的数据可以通过一些内置的方式进行合并pandas.merge可... 阅读全文
posted @ 2015-12-06 12:22 司空格子Ored 阅读(1989) 评论(0) 推荐(0) 编辑
摘要:输入输出一般分为下面几类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据。利用Web API操作网络资源。1、读写文本格式的数据自己感觉读写文件有时候“需要运气”,经常需要手工调整。因为其简单的文件交互语法、直观的数据结构,以及诸如元组打包解包之类的便利功能,Python在文本和文件处理... 阅读全文
posted @ 2015-12-05 16:58 司空格子Ored 阅读(7317) 评论(0) 推荐(0) 编辑
摘要:pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成时间序列功能 既能处理时间序列数据也能处理非时间序列数据的数据结构 数学运算和简约(比如对某个轴求和)可以根据不同的元数据(轴编号)执行 灵活处理缺失数据 合并及其他出现在常见数据库... 阅读全文
posted @ 2015-11-30 09:17 司空格子Ored 阅读(67463) 评论(4) 推荐(5) 编辑
摘要:第四章 Numpy基础:数组和矢量计算第一部分:numpy的ndarray:一种多维数组对象实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于:用于数据整理和... 阅读全文
posted @ 2015-11-27 11:24 司空格子Ored 阅读(4265) 评论(0) 推荐(0) 编辑
摘要:暂略。 阅读全文
posted @ 2015-11-27 10:09 司空格子Ored 阅读(1056) 评论(0) 推荐(0) 编辑
摘要:第一章 准备工作 今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行,这是码这本书的原因。首先按照书上说的进行安装,google下载了epd_free-7.3-1-win-x86.msi,译者建议按照作者的版本安装,EPDFree包括了Numpy,Scipy,matp 阅读全文
posted @ 2015-10-10 21:23 司空格子Ored 阅读(9534) 评论(9) 推荐(4) 编辑