学习进度笔记10

今天继续学习外包杯项目,学习了对数据的清洗和预处理:对原始数据进行清洗、去重、

处理异常值和缺失数据等操作,确保数据质量和准确性。

学习了数据分析和挖掘,学习统计分析 、机器学习和数据挖掘算法等技术,从数据中提取有意义的信息和模式,并进行深入分析。

学习利用分布式计算和并行处理:利用分布式系统和并行计算框架,如Hadoop、Spark等,加速大规模数据的处理和计算过程。

posted @ 2024-01-19 22:42  Espen  阅读(28)  评论(0)    收藏  举报