第17天:个人项目开发 学习目标:开始个人项目的开发,完成数据清洗和特征工程。 具体内容:
数据预处理:使用Spark SQL和DataFrame API清洗数据。
特征工程:将用户和商品特征转换为模型可用的特征向量。
构建训练集和测试集。
任务:
完成数据预处理和特征工程,保存处理后的数据。