今天继续学习外包杯项目,学习了对数据的清洗和预处理:对原始数据进行清洗、去重、
处理异常值和缺失数据等操作,确保数据质量和准确性。
学习了数据分析和挖掘,学习统计分析 、机器学习和数据挖掘算法等技术,从数据中提取有意义的信息和模式,并进行深入分析。
学习利用分布式计算和并行处理:利用分布式系统和并行计算框架,如Hadoop、Spark等,加速大规模数据的处理和计算过程。