01 2021 档案

摘要:1、缺失数据处理 (1)滤除缺失数据 frame.dropna() //删除含有缺失值的行 frame.dropna(how='all') //删除所有值均为缺失值的行 frame.dropna(axis=1, how='all') //删除所有制均为缺失值的列 frame.dropna(thres 阅读全文
posted @ 2021-01-20 00:43 venko 阅读(122) 评论(0) 推荐(0)
摘要:1、dataframe和series的加减 df1 = DataFrame(np.arange(9.).reshape((3, 3)), columns=list('bcd'), index=['Ohio', 'Texas', 'Colorado']) df2 = DataFrame(np.aran 阅读全文
posted @ 2021-01-20 00:04 venko 阅读(141) 评论(0) 推荐(0)
摘要:1、dataframe中的列操作 ***给列赋值:为不存在的列赋值将会创建新的一列*** frame['column1'] = 1 //将frame的第一列赋值为1 frame['column1'] = np.arange(5.) //将frame的第一列赋值为01234 frame['column 阅读全文
posted @ 2021-01-19 22:56 venko 阅读(267) 评论(0) 推荐(0)
摘要:1、安装和导入pandas模块 pip install pandas import pandas as pd 2、读写文本文件csv data = pd.read_csv( my_file.csv , sep= ; , encoding= latin-1 , nrows=1000, skiprows 阅读全文
posted @ 2021-01-19 21:14 venko 阅读(116) 评论(0) 推荐(0)
摘要:【【使用keras自带的路透社新闻数据集运行RNN的实例】】 import numpy as np from sklearn.metrics import accuracy_score from keras.datasets import reuters from keras.preprocessi 阅读全文
posted @ 2021-01-19 13:37 venko 阅读(376) 评论(0) 推荐(0)
摘要:data = datasets.load_digits() X_data = X_data.reshape((X_data.shape[0], X_data.shape[1], X_data.shape[2], 1)) // y_data = to_categorical(y_data) //将类别 阅读全文
posted @ 2021-01-19 03:50 venko 阅读(88) 评论(0) 推荐(0)
摘要:【【以鸢尾花数据集为例,执行决策树模型】】 from sklearn import datasets import numpy as np iris = datasets.load_iris() //导入sklearn 包中自带的鸢尾花 数据集,这是一个包含了三种鸢尾花(山鸢尾、维吉尼亚鸢尾和变色鸢 阅读全文
posted @ 2021-01-19 02:02 venko 阅读(96) 评论(0) 推荐(0)
摘要:【【以鸢尾花数据集为例,执行决策树模型】】 from sklearn import datasets import numpy as np iris = datasets.load_iris() //导入sklearn 包中自带的鸢尾花 数据集,这是一个包含了三种鸢尾花(山鸢尾、维吉尼亚鸢尾和变色鸢 阅读全文
posted @ 2021-01-19 01:48 venko 阅读(65) 评论(0) 推荐(0)
摘要:【【以鸢尾花数据集为例,执行决策树模型】】from sklearn import datasets import numpy as np iris = datasets.load_iris() //导入sklearn 包中自带的鸢尾花 数据集,这是一个包含了三种鸢尾花(山鸢尾、维吉尼亚鸢尾和变色鸢尾 阅读全文
posted @ 2021-01-19 01:37 venko 阅读(55) 评论(0) 推荐(0)
摘要:1、线性代数库linalg 函数描述 dot 两个数组的点积,即元素对应相乘。 vdot 两个向量的点积 inner 两个数组的内积 matmul 两个数组的矩阵积 determinant 数组的行列式 solve 求解线性矩阵方程 inv 计算矩阵的乘法逆矩阵 2、随机游走 实现1000步的随机游 阅读全文
posted @ 2021-01-19 00:19 venko 阅读(86) 评论(0) 推荐(0)
摘要:1、统计函数 numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amax() 用于计算数组中的元素沿指定轴的最大值。 numpy.ptp() 用于计算数组中元素最大值与最小值的差(最大值 - 最小值) b = (np.ptp(a, axis = 1)) //求每行最大值与 阅读全文
posted @ 2021-01-18 23:47 venko 阅读(131) 评论(0) 推荐(0)
摘要:1、二维矩阵的重塑和转置 b = a.reshape(3,2) //将元素数为3*2=6的矩阵a重塑为3行2列的矩阵b c = b.transpose(2,0,1) //c为a的转置 2、高维矩阵的重塑和转置 b = a.reshape(3,2,4) //将元素数为3*2*4=24的矩阵a重塑为三维 阅读全文
posted @ 2021-01-18 21:58 venko 阅读(217) 评论(0) 推荐(0)
摘要:1、数组的加减乘除: !注意区分元素的运算和矩阵的运算! from __future__ import division //导入python未来支持的语言特征division(精确除法),当我们没有在程序中导入该特征时,"/"操作符执行的是截断除法(Truncating Division),当我们 阅读全文
posted @ 2021-01-18 21:24 venko 阅读(178) 评论(0) 推荐(0)
摘要:NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算,这类数值计算广泛用于编写机器学习算法、图像处理、数学任务(MATLAB的快速替代) 1 p 阅读全文
posted @ 2021-01-18 19:44 venko 阅读(191) 评论(0) 推荐(0)