Python for Data Analysis

本文只是一篇类似导向性的分享, 并没有原创内容, 主要是书籍和网络资源的整理, 仅供参考. 可能会有后续补充更新.

资源

Python for Data Analysis 这本书介绍的生态已经非常详尽了, 以下是一些补充. 只是给定关键词, 有兴趣的可以进一步查阅资料.

对其他数据分析语言的用户的友好文档

集成生态的发布版本

科学计算的生态, 一个个安装起来也未必省心, 尤其是 Windows, 有集成了诸如 Numpy, Scipy 等库的第三方发布版本.比如 Anaconda

开发 / 研究工具

  • IPython notebook : 相当于 RStudio 中 Rmd 的编辑和运行的模式, 不过个人认为使用起来更加方便.

  • Pycharm : 更加贴近开发的 IDE.

  • Spyder : 更加接近 Matlab 环境的开发.

IPython Notebook

IPython Notebook - a web-based interactive computational environment

Minibook

Cookbook

性能提升

Python 的数据工具的底层已经做了相当的优化, 除非是生产环境对性能要求非常苛刻, 一般也很少使用, 可以不多做考虑.

  • Cython : Cython is an optimising static compiler for both the Python programming language and the extended Cython programming language (based on Pyrex). 瓶颈的内容可以使用 Cython 配合 C/C++ 做模块替换.

  • Pypy : PyPy is a fast, compliant alternative implementation of the Python language. 是 Python 语法的替换实现, 但是对于 Numpy 生态的支持还不属于稳定阶段.

数据存储

HDF5

HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data.

TODO

  • 相关资源的链接完善

  • 教程文档/视频的列举

  • 例子的给定

更新历史

  • 2015-02-20 添加了 IPython Notebook 和 Python for Finance 的相关学习资源
  • 2015-02-05 添加对其他数据分析语言的用户的友好文档
  • 2015-01-31 创建
posted @ 2015-01-31 13:32  hanzhichao2000  阅读(210)  评论(0)    收藏  举报