积累一些python的操作

os模块管理文件。

import os
os.path.join() #路径拼接
os.makedirs #创建文件夹

urllib模块操作网页 URL,并对网页的内容进行抓取处理。

import urllib
urllib.request.urlretrieve(url, filename=None) #直接将远程数据下载到本地
  • url 下载链接地址
  • filename 本地保存路径

tarfile模块处理tar压缩包。

tar = tarfile.open('待处理文件路径') #打开压缩包
tar.extractall('解压目标路径') #解压包内所有文件
tar.close() #关闭压缩包

numpy

#np.random.permutation对数据进行随机排序
np.random.permutation([0,1,2,3,4,5]) #[3,0,2,1,5,4]

pandas

#iloc用基于整数的下标来进行数据定位/选择
data.iloc[<row selection>, <column selection>]
posted @ 2021-09-28 20:02  昨叶何  阅读(45)  评论(0)    收藏  举报