Python for Data Analysis
本文只是一篇类似导向性的分享, 并没有原创内容, 主要是书籍和网络资源的整理, 仅供参考. 可能会有后续补充更新.
资源
-
A Byte of Python 这是给没有使用过 Python 的人员的入门级材料, 如果有编程基础的话应当一两天就可以上手了.
-
Python for Finance 2015年的新书, 相比前者, 也涵盖了基础的介绍, 适合初学.
Python for Data Analysis 这本书介绍的生态已经非常详尽了, 以下是一些补充. 只是给定关键词, 有兴趣的可以进一步查阅资料.
对其他数据分析语言的用户的友好文档
集成生态的发布版本
科学计算的生态, 一个个安装起来也未必省心, 尤其是 Windows, 有集成了诸如 Numpy, Scipy 等库的第三方发布版本.比如 Anaconda
开发 / 研究工具
-
IPython notebook : 相当于 RStudio 中 Rmd 的编辑和运行的模式, 不过个人认为使用起来更加方便.
-
Pycharm : 更加贴近开发的 IDE.
-
Spyder : 更加接近 Matlab 环境的开发.
IPython Notebook
IPython Notebook - a web-based interactive computational environment
Minibook
-
外面已经有电子版的了, 里面的内容也涵盖了基本的 numpy 及其科学计算生态的简单介绍. 非常推荐 入门学习.
Cookbook
-
暂时还没有找到电子资源, 好在网站本身也开放了大量示例, 也是很好的学习资源.
-
有好的资源欢迎分享
性能提升
Python 的数据工具的底层已经做了相当的优化, 除非是生产环境对性能要求非常苛刻, 一般也很少使用, 可以不多做考虑.
-
Cython : Cython is an optimising static compiler for both the Python programming language and the extended Cython programming language (based on Pyrex). 瓶颈的内容可以使用 Cython 配合 C/C++ 做模块替换.
-
Pypy : PyPy is a fast, compliant alternative implementation of the Python language. 是 Python 语法的替换实现, 但是对于 Numpy 生态的支持还不属于稳定阶段.
数据存储
HDF5
HDF5 is a data model, library, and file format for storing and managing data. It supports an unlimited variety of datatypes, and is designed for flexible and efficient I/O and for high volume and complex data.
-
Pandas 有对 hdf5 格式数据的支持.
TODO
-
相关资源的链接完善
-
教程文档/视频的列举
-
例子的给定
更新历史
- 2015-02-20 添加了 IPython Notebook 和 Python for Finance 的相关学习资源
- 2015-02-05 添加对其他数据分析语言的用户的友好文档
- 2015-01-31 创建

浙公网安备 33010602011771号