积累一些python的操作
os模块管理文件。
import os
os.path.join() #路径拼接
os.makedirs #创建文件夹
urllib模块操作网页 URL,并对网页的内容进行抓取处理。
import urllib
urllib.request.urlretrieve(url, filename=None) #直接将远程数据下载到本地
- url 下载链接地址
- filename 本地保存路径
tarfile模块处理tar压缩包。
tar = tarfile.open('待处理文件路径') #打开压缩包
tar.extractall('解压目标路径') #解压包内所有文件
tar.close() #关闭压缩包
numpy
#np.random.permutation对数据进行随机排序
np.random.permutation([0,1,2,3,4,5]) #[3,0,2,1,5,4]
pandas
#iloc用基于整数的下标来进行数据定位/选择
data.iloc[<row selection>, <column selection>]

浙公网安备 33010602011771号