Python未来可能会学习到的库
-
其它格式数据的使用
- Numpy 该包补充了Python数据类型的不足,多位数组,随机数等数值操作经常使用该类库,学习机器学习,深度学习等内容,需要补全该内容
- Pandas 包,该包补充了许多的数据类型,用于机器学习与深度学习,其中Series替代了原有的字典,DataFrame使一个可以操作大量数据的类似于数据库的经典操作数据结构。Datetime包是为了扩展Python日期类型不足的包,包括非常多日期操作方法。
-
可视化(通常情况下,选择Matplatlib+Seaborn 的方式制造美观的可视化图像)
可视化包非常只多,选择一个适合的可视化包,对于帮助自己分析数据运行过程与结论是非常必要的,对于边写论文,提供图标也是必不可少的操作,因此,学习几款可视化界面包是非常必要的。- Matplatlib
- Seaborn
- Pandas
- Bokeh
- Vispy
- Vega和gega-lite
-
自然语言处理
- 英文
- NTLK
- spaCy
- 中文
- pyn1pir(NLPIR汉语分词系统)
- Jieba(中文分词工具)
- 英文
-
爬虫
- 框架
- scrapy
- grab
- pyspider
- 协议
- urllib
- httplb2
- socket
- hyper
- 框架
-
数据统计
- Statsmodels
- statistics
- SciKit-Learn
-
机器学习
- Scikit-Learn
- Mlpy
- TensorFlow
- Keras/TensorFlow/Theano(深度学习)
-
大数据处理
- Spark
- NoSql
- Memcached
- Redis
- MongoDB
- CouchDB
- HBase
- Cassandra

浙公网安备 33010602011771号