自我介绍
一、自我介绍
大家好,我是蔡阳,目前是一名数据科学与大数据专业的学生。
兴趣爱好:游泳、羽毛球、徒步、骑行、听听音乐、打打游戏,但这些都不是……
讲个故事吧
众生皆乐足矣,丰富多彩,似乎不必刻意成为那锦上花。不善言辞,苑隐寒芒。
Gitee 账号: https://gitee.com/yang__cy
二、技术偏好与能力缺口
SQL 操作能力:掌握 SELECT、INSERT、UPDATE、DELETE 等基础语句,能使用 JOIN 进行多表连接查询,用 GROUP BY、HAVING 做聚合分析。
缺少的能力:
分布式框架实战经验:仅学习过 Hadoop、Spark 的理论概念(如 HDFS 副本机制、Spark RDD),但从未实际搭建过集群,也没做过完整的大数据项目;
机器学习算法深度不足:只会调用 Sklearn 库的现成接口(如线性回归、决策树),不理解算法底层逻辑(如梯度下降原理、决策树剪枝方法);
代码规范性不足:写的脚本注释少、函数划分模糊,比如之前的成绩分析脚本,因为没分模块,后续想修改统计逻辑时,花了 1 小时才找到对应代码段。
三、本学期规划:
框架学习:掌握 Spark 核心操作(RDD、DataFrame、Spark SQL);
代码积累:每周至少提交1次代码到 Gitee,优化代码规范性;
英语提升:每天花30分钟背大数据领域的英语词汇。
当前代码量:
Python:约 1500 行(主要为课程作业,如成绩分析、数据可视化脚本);
SQL:约 800 行(含数据库课程设计、实验报告中的查询语句);
四、WOOP 方法规划:
Wish:
本学期掌握 Spark、Hadoop 基础实战,完成 3 个项目(成绩分析优化、日志分析、简单用户行为预测),课程结束时 Python 代码量达 8000 行,能独立解决 “数据清洗 - 框架处理 - 结果可视化” 的完整需求,期末课程成绩≥85 分。
Outcome:
若愿望实现,不仅能在简历上增加 3 个实战项目,参加学校大数据竞赛时更有底气;后续学习《分布式系统》《机器学习进阶》时,能快速跟上课程节奏;甚至有机会争取到企业的大数据开发实习,减少毕业就业焦虑,家人也会认可我的努力,自己也会更有自信。
Obstacles:
遇到技术难题启动报错容易烦躁;
其他课程作业多,挤占这门课的学习时间;
室友偶尔约打游戏,容易动摇学习计划;
最可能失败因素:拖延、没有及时复习巩固。
坐以观,量力而行;若遇成,尽力而为。