02 2025 档案
摘要:《架构漫谈》系列文章读后感 在阅读《架构漫谈》系列文章的过程中,我仿佛经历了一场关于架构、技术、业务以及软件开发的深度思考之旅。作者王概凯(Kevin)以丰富的架构经验为基础,从架构的本质出发,逐步深入探讨了架构师的角色、架构与技术的关系、软件的本质以及如何写好代码等多个方面。这些内容不仅让我对架构
阅读全文
摘要:学习成果:掌握了Python和Scala的基础与高级特性。深入理解了Spark生态体系的核心组件(Spark SQL、Streaming、MLlib、GraphX)。 未来学习计划:深入学习Spark的性能优化与调优技术。探索更多的机器学习算法,并在Spark MLlib中实践。学习大数据生态中的其
阅读全文
摘要:- 编写了Python装饰器和生成器的示例代码。- 使用Scala实现了高阶函数和模式匹配的示例。
阅读全文
摘要:- Scala复习:- 高阶函数:复习了map、filter、reduce等高阶函数的使用。- 模式匹配:学习了模式匹配在Scala中的应用。- 隐式转换:复习了隐式转换的使用场景与注意事项。
阅读全文
摘要:Python复习: - 装饰器:学习了如何用装饰器增强函数功能。 - 生成器:复习了生成器的使用场景与性能优势。 - 异常处理:复习了try-except-finally的使用。
阅读全文
摘要:编写了Spark SQL、Streaming、MLlib、GraphX的示例代码。运行了复习代码,确保对Spark生态体系的掌握。
阅读全文
摘要:Spark MLlib复习: - 常用算法(线性回归、逻辑回归、协同过滤) - 模型评估与调优 - Spark GraphX复习: - 图的构建与操作 - PageRank算法的实现
阅读全文
摘要:Spark核心概念复习:RDD、DataFrame、Dataset的区别与联系Spark的分布式计算原理*Spark SQL复习:DataFrame的创建与操作SQL查询与优化
阅读全文
摘要:数据可视化与报告生成系统性能优化使用Grafana进行了数据可视化,并优化了系统的性能。
阅读全文
摘要:个人项目开发 - 使用Spark SQL进行数据探索 - 数据可视化使用Spark SQL分析了用户行为数据,并使用Matplotlib进行了数据可视化。
阅读全文
摘要:个人项目规划 - 确定项目主题:基于Spark的电商用户行为分析 - 数据收集与预处理收集了电商用户行为数据,并进行了初步的数据清洗。
阅读全文
摘要:Spark GraphX - 图计算的基本概念 - GraphX中的图操作使用GraphX构建了一个简单的社交网络图,并进行了基本的图分析。
阅读全文
摘要:Spark MLlib - 机器学习基础概念 - MLlib中的分类与回归算法使用MLlib实现了一个简单的线性回归模型。
阅读全文
摘要:Spark Streaming流处理的基本概念DStream的创建与操作使用Spark Streaming处理了一个简单的实时数据流。
阅读全文
摘要:Spark SQLDataFrame与Dataset的介绍SQL查询与DataFrame操作使用Spark SQL查询了一个CSV文件,并进行了简单的数据分析。
阅读全文