2019年7月17日

python学习13之数据泄密

摘要: 在本教程中,您将了解什么是数据泄漏以及如何防止数据泄漏。如果你不知道如何防止它,泄漏将经常出现,它将破坏您的模型在微妙和危险的方式。因此,对于实践数据科学家来说,这是最重要的概念之一。 1、摘要 数据泄漏(或泄漏)发生在您的训练数据包含关于目标的信息时,但是当使用模型进行预测时,将无法获得类似的数据 阅读全文

posted @ 2019-07-17 21:47 喜欢世界的宇宙 阅读(887) 评论(0) 推荐(0)

python学习12之梯度推进

摘要: 在本此学习中,我们将学习如何使用梯度增强来构建和优化模型。这种方法在Kaggle的许多竞争中占据主导地位,并在各种数据集上获得了最先进的结果。 1、摘要 我们已经使用随机森林方法进行了预测,该方法仅通过对许多决策树的预测进行平均就可以获得比单个决策树更好的性能。 我们把随机森林方法称为“集成方法”。 阅读全文

posted @ 2019-07-17 21:20 喜欢世界的宇宙 阅读(250) 评论(0) 推荐(0)

python学习11之交叉验证

摘要: 本次学习,我们将学习如何使用交叉验证来更好地度量模型性能。 1、介绍 机器学习是一个迭代的过程。我们将面临使用什么预测变量、使用什么类型的模型、向这些模型提供什么参数等选择。 到目前为止,通过使用验证集(或holdout)度量模型质量,我们已经以数据驱动的方式做出了这些选择。 为了看到这一点,假设您 阅读全文

posted @ 2019-07-17 19:28 喜欢世界的宇宙 阅读(501) 评论(0) 推荐(0)

导航