随笔分类 -  Python数据分析与处理

摘要:Excel生成二维折线图教程: 1、选中所需要生成图的数据行—点击插入—插入折线图—选点数据标记的折线图(点击),生成初始的折线图 2、向右拖动二维折线图的右下角,可以拉长整个图像 3、单击图像,点击右上角第一个图标,勾选数据标签,生成标有数据大小的图像 4、单击图像坐标轴,选择右边坐标轴选项—填充 阅读全文
posted @ 2021-12-10 18:35 The-Chosen-One 阅读(6794) 评论(0) 推荐(0) 编辑
摘要:最原始从官网下载: pip install tensorflow 从国内镜像网站安装最新版本: pip install tensorflow -i http://pypi.douban.com/simple/ 或者指定版本号: pip install tensorflow==1.14.0 -i ht 阅读全文
posted @ 2021-12-03 17:42 The-Chosen-One 阅读(2709) 评论(0) 推荐(0) 编辑
摘要:三种方式绘制箱线图#第一种:直接使用自带的箱线图函数import pandas as pdimport matplotlib.pyplot as pltdata=pd.read_excel("finaldata.xlsx")plt.rcParams["font.sans-serif"]=["SimH 阅读全文
posted @ 2020-08-04 20:47 The-Chosen-One 阅读(9028) 评论(0) 推荐(0) 编辑
摘要:import matplotlib.pyplot as pltplt.rcParams["font.sans-serif"]=["SimHei"]#输出图像的标题可以为中文正常输出plt.rcParams["axes.unicode_minus"]=False #可以正常输出图线里的负号name_l 阅读全文
posted @ 2020-08-02 17:26 The-Chosen-One 阅读(5169) 评论(0) 推荐(0) 编辑
摘要:1.np.where语句可以使用import numpy as npa=np.array([[1,2,3], [1,2,1],[1,1,1]])print(a)b=np.array([1,2,1])print(b)for i in range(len(a)): if np.where((a[i,:] 阅读全文
posted @ 2020-07-31 15:49 The-Chosen-One 阅读(230) 评论(0) 推荐(0) 编辑
摘要:最近在码代码时想判断两个矩阵是否完全相同(每个元素都相同),于是我这样写了: 发现用==判断只能返回一个判断矩阵,表示其中每一个元素是否对应相等。应该这么写: 如果两个矩阵中的所有元素对应相等,则返回True,反之返回False。如果判断两个矩阵中是否有相等的元素,有任何一个相等就行,这种情况就可以 阅读全文
posted @ 2020-07-23 14:57 The-Chosen-One 阅读(14571) 评论(0) 推荐(0) 编辑
摘要:ImportError: cannot import name 'GridspecLayout' from 'ipywidgets' 出现的主要原因是其ipywidgets的版本太低,所以你首先要做的是查看你的ipywidgets的版本,然后再去安装最新版的版本,需要的版本是7.5.2 做法如下: 阅读全文
posted @ 2020-07-12 12:03 The-Chosen-One 阅读(898) 评论(0) 推荐(0) 编辑
摘要:KFold分成不同的份数进行模型的平均表现输出即可#1-1KFold交叉验证方式from sklearn.datasets import load_irisfrom sklearn.feature_selection import SelectKBest,f_classiffrom sklearn. 阅读全文
posted @ 2020-05-27 18:53 The-Chosen-One 阅读(1065) 评论(0) 推荐(0) 编辑
摘要:XGboost数据比赛实战之调参篇(完整流程) 首先,很幸运的是,Scikit-learn中提供了一个函数可以帮助我们更好地进行调参: sklearn.model_selection.GridSearchCV 常用参数解读: estimator:所使用的分类器,如果比赛中使用的是XGBoost的话, 阅读全文
posted @ 2020-05-27 18:51 The-Chosen-One 阅读(657) 评论(0) 推荐(0) 编辑
摘要:单变量特征选择 单变量特征选择是通过选择那些基于单变量统计检验(univariate statistical tests)得出的最优特征来实现的。它可以看作是估计器的一个预处理步骤。Scikit-learn将一系列特征选择程序作为不同的类提供给我们,这些类都实现了 transform 方法: Sel 阅读全文
posted @ 2020-05-27 18:17 The-Chosen-One 阅读(766) 评论(0) 推荐(0) 编辑
摘要:#机器学习项目实战1-泰坦尼克号获救预测#1-1数据导入pandas库import pandas as pdpd.set_option("max_columns",1000) #设置最大展示列的数目为1000pd.set_option("max_rows",1000) #设置最大展示行的数目为100 阅读全文
posted @ 2020-05-27 17:36 The-Chosen-One 阅读(736) 评论(0) 推荐(0) 编辑
摘要:#1-1二维数据表格文件的读入操作df=pd.read_excel(r"D:\Byrbt2018\Study\Python数据分析技术基础课程+练习+讲解\Python数据分析课程+练习+讲解\作业\作业3\作业3\香港酒店数据.xlsx") #r表示默认不是转义字符print(df)print(d 阅读全文
posted @ 2020-04-23 10:15 The-Chosen-One 阅读(1829) 评论(0) 推荐(0) 编辑
摘要:python中数据含量统计: 对于:pandas表格数据numpy的数组型数据均可以通过value_counts()函数来进行输出 pandas表格:print(data["size"].value_counts()) numpy的数组型:print(n[0].value_counts())结果输出 阅读全文
posted @ 2020-03-25 12:21 The-Chosen-One 阅读(2208) 评论(0) 推荐(0) 编辑
摘要:1、根据神经网络建立模型的复杂度和数据模型真正复杂度之间的相对大小,其主要存在三种情况:(1)欠拟合:underfitting (2)相对准确 (3)过拟合:overfitting 图2、一般情况下在不知数据模型复杂度的情况下,很容易出现建立模型过拟合的情况,这是因为原始数据中本身存在一些噪声数据, 阅读全文
posted @ 2019-10-11 19:27 The-Chosen-One 阅读(3389) 评论(0) 推荐(0) 编辑
摘要:对于0-9的10分类任务神经网络搭建主要有两种方式:(1)底层原理实现方式和(2)调用函数搭建方式,整体的过程原理如下所示 (1)底层原理实现方式 import torchimport torch.nn.functional as Fa=torch.full([4],1/4)print(a)print(-1*a*torch.log2(a))b=-1*a*torch.log2(a)print(s... 阅读全文
posted @ 2019-10-09 00:01 The-Chosen-One 阅读(2845) 评论(0) 推荐(0) 编辑
摘要://2019.10.08神经网络与全连接层1、logistics regression逻辑回归的思想是将数据利用激活函数sigmoid函数转换为0-1的概率,然后定义一定的阈值0.5,大于阈值则为一类,小于阈值则为另一类。它主要用来解决的是二分类问题,也可以通过一定的变形解决多分类的问题。2、对于逻 阅读全文
posted @ 2019-10-08 23:37 The-Chosen-One 阅读(1017) 评论(0) 推荐(0) 编辑
摘要:python三维图像输出的代码如下所示:#画3D函数图像输出from mpl_toolkits.mplot3d import Axes3Dfrom matplotlib import cmimport matplotlib.pyplot as pltimport numpy as npimport mpl_toolkits.mplot3dfigure=plt.figure()#ax = Axes3 阅读全文
posted @ 2019-09-27 20:44 The-Chosen-One 阅读(10387) 评论(0) 推荐(2) 编辑
摘要:pytorch随机梯度下降法1、梯度、偏微分以及梯度的区别和联系(1)导数是指一元函数对于自变量求导得到的数值,它是一个标量,反映了函数的变化趋势;(2)偏微分是多元函数对各个自变量求导得到的,它反映的是多元函数在各个自变量方向上的变化趋势,也是标量;(3)梯度是一个矢量,是有大小和方向的,其方向是 阅读全文
posted @ 2019-09-27 20:41 The-Chosen-One 阅读(9076) 评论(1) 推荐(0) 编辑
摘要:pytorch数学运算与统计属性入门1、Broadcasting (维度)自动扩展,具有以下两个重要特征:(1)expand (2)without copying data重点的核心实现功能是:(1)在前面增加缺失的维度(2)将其中新增加的维度的size扩展到需要相互运算的tensor维度的same 阅读全文
posted @ 2019-09-24 22:39 The-Chosen-One 阅读(2659) 评论(0) 推荐(1) 编辑
摘要:(1-1)pytorch张量数据的索引与切片操作1、对于张量数据的索引操作主要有以下几种方式:a=torch.rand(4,3,28,28):DIM=4的张量数据a(1)a[:2]:取第一个维度的前2个维度数据(不包括2);(2)a[:2,:1,:,:]:取第一个维度的前两个数据,取第2个维度的前1 阅读全文
posted @ 2019-09-19 22:40 The-Chosen-One 阅读(18981) 评论(0) 推荐(3) 编辑