2025年2月10日
posted @ 2025-02-10 21:00
石铁生
阅读(7)
推荐(0)
2025年2月8日
摘要:
今天尝试使用Matplotlib和Seaborn对Spark处理后的数据进行可视化。通过绘制柱状图、折线图和散点图,直观地展示了数据的分布和趋势。
阅读全文
posted @ 2025-02-08 20:01
石铁生
阅读(8)
推荐(0)
2025年2月7日
摘要:
学习了如何使用Spark SQL进行数据查询和分析。通过将数据加载为DataFrame,使用SQL语句进行查询和聚合操作。
阅读全文
posted @ 2025-02-07 20:02
石铁生
阅读(9)
推荐(0)
2025年2月6日
摘要:
今天学习了如何使用Spark进行数据清洗和预处理。
阅读全文
posted @ 2025-02-06 22:04
石铁生
阅读(11)
推荐(0)
2025年2月5日
摘要:
学习了如何使用Python的Requests库进行简单的网页爬取。通过编写爬虫脚本,成功抓取了一些网页数据,并将其保存为CSV文件。
阅读全文
posted @ 2025-02-05 21:03
石铁生
阅读(13)
推荐(0)
2025年2月4日
摘要:
今天初步了解了Spark的核心概念,包括RDD、DataFrame和Dataset。
阅读全文
posted @ 2025-02-04 22:01
石铁生
阅读(9)
推荐(0)
摘要:
未来职业规划报告薛晨昊(石家庄铁道大学,河北省石家庄市 邮编:050000)摘 要:本篇报告主要对我个人目前掌握的职业技能以及当前IT行业就业市场的相关岗位进行了分析与匹配,旨在为未来的职业发展制定清晰的规划。首先,报告详细阐述了我在大学期间通过课程学习和项目实践所掌握的专业知识和技能,包括Java
阅读全文
posted @ 2025-02-04 22:00
石铁生
阅读(28)
推荐(0)
摘要:
今天开始学习大数据爬取,配置了Linux虚拟机和Spark环境。安装了Java、Scala和Spark,并设置了环境变量。虽然遇到了一些依赖问题,但通过经过我的不屑努力,最终成功配置好了基础环境。
阅读全文
posted @ 2025-02-04 21:00
石铁生
阅读(6)
推荐(0)
摘要:
明天就过年了,今天收拾了一下家里
阅读全文
posted @ 2025-02-04 20:00
石铁生
阅读(10)
推荐(0)
2025年1月26日
摘要:
软件企业产品技术管理的战略与实践研究薛晨昊(石家庄铁道大学,河北省石家庄市 邮编:050000)摘 要:在全球数字经济rapid transformation的大背景下,软件企业的技术管理能力已成为决定其市场竞争力和可持续发展的关键要素。本研究通过系统性文献分析、实证研究和案例研究相结合的方法,深入
阅读全文
posted @ 2025-01-26 21:59
石铁生
阅读(13)
推荐(0)