python库

1.标准库

dir() #查看模块中所包含的工具

help() #展示模块中所有方法的说明

例如看到math模块中所有方法的名称

import math

dir(math) 

 

2.各个模块简介和应用场景

 

模块名称 模块简介 应用场景
数学模块(math) 包含很多科学计算方法,如平方根、对数计算、三角函数,等等 在数据挖掘中,经常要对数据进行标准化、求统计值等处理,math模块基本上包含了所用的基本操作

日期时间模块(datetime)

主要用于处理时间类型的数据,如时间数据格式化、时间的获取、时间数据与字符串的转换,等等 数据通常都会带有时间戳,有时,时间也是一种重要特征。如新闻中,有新闻的发生时间、发布时间等,就会用到该模块
随机模块(random) 主要可以进行随机数的生成,随机选取 在进行数据取样、数据生成时经常会用到这些随机方法
文件操作模块(file) 主要提供了文件操作,包括文件的读取和写入等,在处理本地数据时,通常会用到这些操作 数据挖掘的样本通常会被存放在文件中,所以文件操作也是基本操作之一
正则匹配模块(re) 可以使用正则表达式来进行字符串的匹配、检测等,其编写方法可以在网上搜索一下 在处理文本数据时,经常需要用到正则匹配来进行文本搜索
系统接口模板(sys) 主要实现了与操作系统交互的一些功能,如获取当前操作系统的情况、设置编码格式等,编写完整的程序通常都会用到 系统接口模块主要是为了获取系统的各种数据

 

第三方库---基础模块

 

名称 含义
Numpy Python语言扩展程序库,支持大量的维度数组与矩阵运算
SciPy 集成了数学、科学与工程的计算包,他用于有效计算Numpy矩阵使Numpy和Scipy协同工作
Matplotlib 专门用来绘图的工具包,可以使用它来进行数据可视化
pandas 数据分析工具包,它基于NumPy构建,纳入了大量的库和标准数据模型

第三方库--机器学习

名称 含义
scikit-learn 基于SciPy进行延伸的机器学习工具包,包含大量的机器学习算法模具,有6大基本功能:分类、回归、聚类、数据降维、模型选择和数据预处理
OpenCV 非常庞大的图像处理库,实现了非常多的图像和视频处理方法,如图像视频加载、基础特征获取、边缘检测等,处理图像通常都需要其支持
NLTK 比较传统的自然语言处理模块,自带很多语料,以及全面的传统自然语言处理算法,比如字符串处理、卡方检验等,非常适合自然语言入门使用
Gensim 包含了浅层词嵌入的文本处理模块,以及常用的自然语言处理相关方法,如TF-IDF、word2vec等模型

第三方库--深度学习平台

平台名称 开发平台 优点
TensorFlow 谷歌 相对成熟、应用广泛、服务全面、提供学习视频和其认证计划
PyTorch Facebook 支持更加快速地构建项目
PaddlePaddle 百度 中文文档全面,对于汉语的相关模型比较丰富

 

posted @ 2022-02-23 20:31  曲奇酸奶  阅读(70)  评论(0)    收藏  举报