实际的数据分析中,我们大部分时间都在进行数据清洗(data cleansing),即对原数据进行筛选和转换,使其更易于分析。这个筛选和转换的过程也叫数据处理(data manipulation)。我们将在第 12 章中详细介绍这个主题。在这一小节,我们直接假设数据已经过处理,可以用于分析。我们不对模型做深入介绍,而是使用一些简单的模型,让你认识到如何用数据拟合模型,如何与拟合好的模型进行交互,以及如何使用拟合模型做预测。
拟合线性模型
拟合回归树