11 2018 档案

摘要:具体安装教程参见上一篇博客。 1、有几种格式code,编码模式;markdown注释格式; 2、如果出现no module named ‘XX’ ,需要在anaconda prompt中使用conda install XX,如果不行可以先使用conda install pip安装pip,再在anac 阅读全文
posted @ 2018-11-22 17:25 simpleDi 阅读(912) 评论(0) 推荐(0)
摘要:之前先是安装了pycharm,手动安装了python2.7和3.7版本,在pycharm里面使用alt+/手动下载包。后来想使用jupyter lab,手动下载包太麻烦且有版本管理的文艺,于是打算装Anaconda。 anaconda里面集成了包括python在内的很多工具,该python包含了很多 阅读全文
posted @ 2018-11-20 22:14 simpleDi 阅读(2484) 评论(0) 推荐(0)
摘要:在机器学习中,一般都需要先对数据进行数据预处理工作。模型一般需要反复的调参,因此可能需要多次使用预处理之后的数据,但是反复进行数据的预处理工作是多余的,我们可以将其保存下来。 阅读全文
posted @ 2018-11-20 11:35 simpleDi 阅读(1147) 评论(0) 推荐(0)
摘要:random_state是一个随机种子,是在任意带有随机性的类或函数里作为参数来控制随机模式。当random_state取某一个值时,也就确定了一种规则。 random_state可以用于很多函数,我比较熟悉的是用于以下三个地方:1、训练集测试集的划分 2、构建决策树 3、构建随机森林 1、划分训练 阅读全文
posted @ 2018-11-19 22:22 simpleDi 阅读(27267) 评论(0) 推荐(2)
摘要:一、一般的模型调参原则 1、调参前提:模型调参其实是没有定论,需要根据不同的数据集和不同的模型去调。但是有一些调参的思想是有规律可循的,首先我们可以知道,模型不准确只有两种情况:一是过拟合,而是欠拟合。过拟合是指模型过于复杂,欠拟合是指模型过于简单。 2、查找资料:调参时应该知道每一个参数的默认值是 阅读全文
posted @ 2018-11-18 21:59 simpleDi 阅读(6613) 评论(0) 推荐(0)
摘要:1.安装graphviz。 graphviz本身是一个绘图工具软件,下载地址在:http://www.graphviz.org/。如果你是linux,可以用apt-get或者yum的方法安装。如果是windows,就在官网下载msi文件安装。无论是linux还是windows,装完后都要设置环境变量 阅读全文
posted @ 2018-11-16 22:11 simpleDi 阅读(20729) 评论(0) 推荐(3)
摘要:# View more python tutorials on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/pythontu... 阅读全文
posted @ 2018-11-15 16:36 simpleDi 阅读(3124) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 16:34 simpleDi 阅读(1856) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 16:33 simpleDi 阅读(1075) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 16:14 simpleDi 阅读(1436) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 16:02 simpleDi 阅读(1577) 评论(0) 推荐(0)
摘要:#调用查看线性回归的几个属性 # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/pythontutorial """ Please note, this code is only for pyt... 阅读全文
posted @ 2018-11-15 15:38 simpleDi 阅读(449) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 15:34 simpleDi 阅读(1659) 评论(0) 推荐(0)
摘要:# View more python learning tutorial on my Youtube and Youku channel!!! # Youtube video tutorial: https://www.youtube.com/channel/UCdyjiB5H8Pu7aDTNVXTTpcg # Youku video tutorial: http://i.youku.com/... 阅读全文
posted @ 2018-11-15 15:33 simpleDi 阅读(1495) 评论(0) 推荐(0)
摘要:一、机器学习算法分类: 监督学习:提供数据和数据分类标签。——分类、回归 非监督学习:只提供数据,不提供标签。 半监督学习 强化学习:尝试各种手段,自己去适应环境和规则。总结经验利用反馈,不断提高算法质量 遗传算法:淘汰弱者,留下强者,进行繁衍和变异穿产生更好的算法。 二、选择机器学习算法和数据集 阅读全文
posted @ 2018-11-14 22:00 simpleDi 阅读(1571) 评论(0) 推荐(0)
摘要:安装matplotlib和seaborn https://blog.csdn.net/Jia_jinjin/article/details/80428598 seaborn pairplot:特征两两对比 参数说明: data:数据。 g = sns.pairplot(data) hue:根据指定的 阅读全文
posted @ 2018-11-12 22:09 simpleDi 阅读(2320) 评论(1) 推荐(2)
摘要:敲《Python机器学习及实践》上的code的时候,对于数据预处理中涉及到的fit_transform()函数和transform()函数之间的区别很模糊,查阅了很多资料,这里整理一下: 涉及到这两个函数的代码如下: 我们先来看一下这两个函数的API以及参数含义:1、fit_transform()函 阅读全文
posted @ 2018-11-12 21:39 simpleDi 阅读(4615) 评论(0) 推荐(0)
摘要:一、特征选择方法分类 1、特征选择也是对数据进行预处理的一个步骤,在进行特征选择的时候我们有以下两个原则,即指导方向: 特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有什么用。 特征与目标的相关性:这点比较显见,与目标相关性高的 阅读全文
posted @ 2018-11-08 11:24 simpleDi 阅读(1838) 评论(0) 推荐(0)
摘要:1、matplotlib.pyplot 2、sklearn 是一个python中的机器学习库,寂静基本实现了所有机器学习的算法。 3、StratifiedKFold 参考链接:https://blog.csdn.net/u012735708/article/details/82258615 Stra 阅读全文
posted @ 2018-11-07 14:44 simpleDi 阅读(2194) 评论(0) 推荐(0)
摘要:参考文献:https://baijiahao.baidu.com/s?id=1609320767556598767&wfr=spider&for=pc 三者都是对数据进行预处理的方式。 标准化(Standardization) 归一化(normalization) 正则化(regularizatio 阅读全文
posted @ 2018-11-06 21:25 simpleDi 阅读(11204) 评论(0) 推荐(0)
摘要:一、简介 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,pandas为时间序列分析提供了很好的支持。 二、数据结构 阅读全文
posted @ 2018-11-05 10:58 simpleDi 阅读(1294) 评论(0) 推荐(0)
摘要:之前一直用java做软件开发,现在项目中需要做预测,然后入了机器学习的坑,现在还是入门小白。 因为之前一直用的java,所以打算用java的机器学习库——mahout。之后发现很多机器学习的资料都是基于python,一直纠结要不要转战python。 被各种机器学习框架和深度学习框架搞得眼花缭乱,现在 阅读全文
posted @ 2018-11-02 11:22 simpleDi 阅读(1088) 评论(0) 推荐(0)
摘要:一、命令式编程(imperative)和符号式编程(symblic) 命令式: 当程序执行到 c=b∗a时,代码开始做对应的数值计算. 符号式编程于此不同,需要先给出一个函数的定义(可能十分复杂).当我们定义这个函数时,并不会做真正的数值计算.这类函数的定义中使用数值占位符.当给定真正的输入后,才会 阅读全文
posted @ 2018-11-02 10:35 simpleDi 阅读(2021) 评论(0) 推荐(0)