随笔分类 - 机器学习-项目流程
摘要:模型微调 假设我们现在已经有了几个效果还不错的模型,接下来我们要对它们进行调优。下面我们介绍几种调优的方法。 网格搜索 第一个方法是通过手动调整超参数,直到发现一组使模型表现良好的超参数。这个是一个很耗时的工作,手动调整的话,可能没有这么多时间探索这些超参数组合。 不过在sk-learn 中提供了G
阅读全文
摘要:选择并训练模型 至此,我们已明确了问题,并对数据进行了预处理。现在我们选择并训练一个机器学习模型。 在训练集上训练模型 这个过程相对来说较为简单,我们首先训练一个线性回归模型: from sklearn.linear_model import LinearRegression lin_reg = L
阅读全文
摘要:为机器学习准备数据 下面我们开始为机器学习算法准备数据,首先我们将训练集中的 label(也就是median_house_value)分出来: housing = strat_train_set.drop('median_house_value', axis=1) housing_labels =
阅读全文
摘要:探索并可视化数据 到目前为止我们已经大致浏览了数据集,我们下一步的目标是更深入的了解数据集。 首先,我们要将测试集放在一边,确保我们仅浏览训练集。当然,如果训练集特别大的话,我们可能需要对它进行采样,获取它的一个小样本集进行研究。在我们的这个例子中,这个数据集非常小,所以我们可以直接在整个训练集上进
阅读全文
摘要:机器学习项目流程 在这我们会从头开始做一个机器学习项目,向大家展示一个机器学习项目的一个基本流程与方法。一个机器学习主要分为以下几个步骤: 从整体上了解项目 获取数据 发现并可视化数据,以深入了解数据 为机器学习算法准备数据 选择模型并训练 模型调优 展示解决方案 部署、监控、以及维护我们的系统 我
阅读全文
浙公网安备 33010602011771号