python库
1.标准库
dir() #查看模块中所包含的工具
help() #展示模块中所有方法的说明
例如看到math模块中所有方法的名称
import math
dir(math)
2.各个模块简介和应用场景
| 模块名称 | 模块简介 | 应用场景 |
| 数学模块(math) | 包含很多科学计算方法,如平方根、对数计算、三角函数,等等 | 在数据挖掘中,经常要对数据进行标准化、求统计值等处理,math模块基本上包含了所用的基本操作 |
|
日期时间模块(datetime) |
主要用于处理时间类型的数据,如时间数据格式化、时间的获取、时间数据与字符串的转换,等等 | 数据通常都会带有时间戳,有时,时间也是一种重要特征。如新闻中,有新闻的发生时间、发布时间等,就会用到该模块 |
| 随机模块(random) | 主要可以进行随机数的生成,随机选取 | 在进行数据取样、数据生成时经常会用到这些随机方法 |
| 文件操作模块(file) | 主要提供了文件操作,包括文件的读取和写入等,在处理本地数据时,通常会用到这些操作 | 数据挖掘的样本通常会被存放在文件中,所以文件操作也是基本操作之一 |
| 正则匹配模块(re) | 可以使用正则表达式来进行字符串的匹配、检测等,其编写方法可以在网上搜索一下 | 在处理文本数据时,经常需要用到正则匹配来进行文本搜索 |
| 系统接口模板(sys) | 主要实现了与操作系统交互的一些功能,如获取当前操作系统的情况、设置编码格式等,编写完整的程序通常都会用到 | 系统接口模块主要是为了获取系统的各种数据 |
第三方库---基础模块
| 名称 | 含义 |
| Numpy | Python语言扩展程序库,支持大量的维度数组与矩阵运算 |
| SciPy | 集成了数学、科学与工程的计算包,他用于有效计算Numpy矩阵使Numpy和Scipy协同工作 |
| Matplotlib | 专门用来绘图的工具包,可以使用它来进行数据可视化 |
| pandas | 数据分析工具包,它基于NumPy构建,纳入了大量的库和标准数据模型 |
第三方库--机器学习
| 名称 | 含义 |
| scikit-learn | 基于SciPy进行延伸的机器学习工具包,包含大量的机器学习算法模具,有6大基本功能:分类、回归、聚类、数据降维、模型选择和数据预处理 |
| OpenCV | 非常庞大的图像处理库,实现了非常多的图像和视频处理方法,如图像视频加载、基础特征获取、边缘检测等,处理图像通常都需要其支持 |
| NLTK | 比较传统的自然语言处理模块,自带很多语料,以及全面的传统自然语言处理算法,比如字符串处理、卡方检验等,非常适合自然语言入门使用 |
| Gensim | 包含了浅层词嵌入的文本处理模块,以及常用的自然语言处理相关方法,如TF-IDF、word2vec等模型 |
第三方库--深度学习平台
| 平台名称 | 开发平台 | 优点 |
| TensorFlow | 谷歌 | 相对成熟、应用广泛、服务全面、提供学习视频和其认证计划 |
| PyTorch | 支持更加快速地构建项目 | |
| PaddlePaddle | 百度 | 中文文档全面,对于汉语的相关模型比较丰富 |

浙公网安备 33010602011771号