2019年7月30日

python学习中的序列函数

摘要: 1、enumerate函数 当你索引数据时,使⽤enumerate的⼀个好⽅法是计算序列(唯 ⼀的)dict映射到位置的值: 2、sorted函数 sorted函数是可以从任何一个序列的元素返回一个新的排好序的列表: 3、zip函数 zip可以将多个列表、元组或其他序列成对组合成一个元组列表: zi 阅读全文

posted @ 2019-07-30 10:34 喜欢世界的宇宙 阅读(937) 评论(0) 推荐(0) 编辑

2019年7月27日

关于python中的小知识总结

摘要: 1、使用isinstance函数检查对象是什么类型的。 isinstance可以用类型元祖,检查对象的类型是否在元组中: 2、python中的引入 在python中,模块就是一个有.py扩展名、包含python代码的文件,假设有以下模块: 如果想要从同目录下的另一个文件访问some_module.p 阅读全文

posted @ 2019-07-27 17:21 喜欢世界的宇宙 阅读(308) 评论(0) 推荐(0) 编辑

2019年7月17日

python学习13之数据泄密

摘要: 在本教程中,您将了解什么是数据泄漏以及如何防止数据泄漏。如果你不知道如何防止它,泄漏将经常出现,它将破坏您的模型在微妙和危险的方式。因此,对于实践数据科学家来说,这是最重要的概念之一。 1、摘要 数据泄漏(或泄漏)发生在您的训练数据包含关于目标的信息时,但是当使用模型进行预测时,将无法获得类似的数据 阅读全文

posted @ 2019-07-17 21:47 喜欢世界的宇宙 阅读(747) 评论(0) 推荐(0) 编辑

python学习12之梯度推进

摘要: 在本此学习中,我们将学习如何使用梯度增强来构建和优化模型。这种方法在Kaggle的许多竞争中占据主导地位,并在各种数据集上获得了最先进的结果。 1、摘要 我们已经使用随机森林方法进行了预测,该方法仅通过对许多决策树的预测进行平均就可以获得比单个决策树更好的性能。 我们把随机森林方法称为“集成方法”。 阅读全文

posted @ 2019-07-17 21:20 喜欢世界的宇宙 阅读(220) 评论(0) 推荐(0) 编辑

python学习11之交叉验证

摘要: 本次学习,我们将学习如何使用交叉验证来更好地度量模型性能。 1、介绍 机器学习是一个迭代的过程。我们将面临使用什么预测变量、使用什么类型的模型、向这些模型提供什么参数等选择。 到目前为止,通过使用验证集(或holdout)度量模型质量,我们已经以数据驱动的方式做出了这些选择。 为了看到这一点,假设您 阅读全文

posted @ 2019-07-17 19:28 喜欢世界的宇宙 阅读(466) 评论(0) 推荐(0) 编辑

2019年7月16日

python学习10之管道清理建模

摘要: 在本次得学习中,我们将会学习如何使用管道清理建模代码。 1、介绍 管道是保持数据预处理和建模代码组织的简单方法。 具体来说,一个管道捆绑包预处理和建模步骤,这样您就可以像使用单个步骤一样使用整个捆绑包。 2、管道使用的好处 更简洁的代码:在预处理的每个步骤中计算数据可能会变得混乱。使用管道,我们不需 阅读全文

posted @ 2019-07-16 22:10 喜欢世界的宇宙 阅读(215) 评论(0) 推荐(0) 编辑

python学习09之分类变量

摘要: 本次学习,我们将了解什么是分类变量以及处理这类数据的三种方法。 1、介绍 分类变量只接受有限数量的值。 考虑一项调查,询问你多久吃一次早餐,并提供四个选项:“从不”、“很少”、“大多数日子”或“每天”。 在本例中,数据是分类的,因为响应属于一组固定的类别。如果人们对他们所拥有的汽车品牌进行调查,他们 阅读全文

posted @ 2019-07-16 18:32 喜欢世界的宇宙 阅读(856) 评论(1) 推荐(1) 编辑

2019年7月15日

python学习08之处理缺失值

摘要: 1、缺失值的处理 我们将学习三种处理缺失值的方法。然后我们将比较这些方法在实际数据集上的有效性。 缺失值的介绍: 有很多种方法可以使数据以丢失的值结束。 例如: 两居室的房子不包括第三居室大小的价值。 调查对象可选择不分享其收入。 如果尝试使用缺少值的数据构建模型,大多数机器学习库(包括SciKit 阅读全文

posted @ 2019-07-15 21:18 喜欢世界的宇宙 阅读(2061) 评论(1) 推荐(0) 编辑

2019年7月14日

python学习07之总结图

摘要: 1、各类图的作用 由于不总是很容易决定如何最好地讲述数据背后的故事,因此我们将图表类型分为三大类来帮助实现这一点。 1)、趋势类 趋势被定义为一种变化模式。 sns.lineplot-折线图最适合显示一段时间内的趋势,多条线可用于显示多个组中的趋势。 2)、关系类 我们可以使用许多不同的图表类型来理 阅读全文

posted @ 2019-07-14 20:40 喜欢世界的宇宙 阅读(264) 评论(0) 推荐(0) 编辑

python学习06之柱形图

摘要: 1、加载并检查数据 2、创建柱形图 代码解析: 我们使用两个额外的信息自定义命令的行为: a=选择要绘制的列(在本例中,我们选择了“花瓣长度(cm)”)。 在创建直方图时,我们总是会提供kde=False,因为省略它会创建一个稍微不同的图。 3、创建密度图 这种类型的图是内核密度估计(KDE)图。如 阅读全文

posted @ 2019-07-14 20:17 喜欢世界的宇宙 阅读(554) 评论(0) 推荐(0) 编辑

导航