自我介绍
大家好,我是一名数据科学与大数据技术专业的学生,我的兴趣爱好还挺多的,喜欢唱歌,喜欢美食,喜欢旅游,喜欢散步,喜欢追剧,喜欢种花,喜欢养小动物等等,我是个十足的 “美食爱好者”,尤其是喜欢自己动手做各种好吃的,记得我第一次想自己做吃的,我第一次煎蛋,我忘记放油,结果“蛋炒没了”,我想着,我一定要煎一个漂亮蛋,终于成功,哈哈,心想:“下次我要挑战难一点的”,第二次是我想做煎饼吃,我从冰箱里拿出饼,往锅里倒油,不知倒多少,全凭感觉,然后开大火,把油热来,饼一放,手忙脚乱,火调小,给它翻一面,啊哈,不妙,又黑又硬的一面映入我的眼帘,完了,我煎出了个啥玩意啊,这能吃吗?最终它的归宿之地就是厨房的垃圾桶,算了,还是弄煎蛋配面吧。之后,每次弄吃的,都跟着手机上的教程,一步一步的去做,果然,我学会了许多,会做西红柿炒蛋,辣椒炒肉,凉拌黄瓜,黄瓜炒火腿肠等等。
1、技能树:
2、已具备能力:
能力A:能使用 Python 的pandas库进行数据读取、清洗(如处理缺失值、重复值)、转换(如数据类型转换、字段衍生),并进行简单的统计分析(如计算均值、中位数、分组统计)。
能力B:掌握 SQL 基本语法,可完成单表及多表的查询(如JOIN操作)、插入、更新、删除等操作,能基于业务需求编写简单的数据分析 SQL 语句。
能力C:熟悉 Hadoop 生态系统,了解 HDFS 分布式文件系统的存储原理与操作,能运用 MapReduce 进行分布式数据计算;掌握 Linux 系统操作,可在 Linux 环境下进行系统管理、软件部署等工作。
技术兴趣方向:对大数据分析与挖掘方向兴趣浓厚,尤其是如何从海量复杂数据中挖掘有价值的信息,以及数据驱动的业务决策相关技术。
欠缺能力:
缺乏大规模数据处理经验,对于分布式计算框架(如 Hadoop、Spark)的实际应用能力不足。
数据分析的深度不够,在复杂业务场景下,对数据的洞察和建模能力有待提升,比如难以快速确定合适的分析方法解决复杂业务问题。
数据可视化的创新性和交互性不足,目前只能制作基础静态图表,对于动态、交互式可视化工具(如 Tableau、Power BI)的使用还不熟练。
课程收获与角色期待:希望在课程中系统学习大数据分析的核心技术与方法,提升大规模数据处理和复杂场景下的数据分析能力。
未来选择:计划毕业后进入互联网公司从事大数据分析相关工作。
3、当前准备:
学习上,
优势:对数据分析有浓厚兴趣,具备一定的 Python 和 SQL 基础,有自主学习和探索的积极性,能快速吸收新知识。
劣势:缺乏企业级大数据项目实战经验,对行业内实际业务场景的理解不够深入;与计算机专业同学相比,在分布式系统等底层技术方面的知识储备相对薄弱。
4、本学期规划:
拿下英语六级,备考计算机二级以及软考,巩固技术
代码量情况
目前代码量:800行
课程时间投入与 WOOP 计划(数据分析类)
每周时间投入:每周安排2小时学习本课程知识,认真完成课程作业与实践项目,确保对课堂内容的深入理解与掌握。
5、WOOP 计划
Wish(愿望):在本课程结束时,能够独立完成一个完整的大数据分析项目,从数据获取、清洗、分析建模到可视化呈现,并且课程相关代码量达到 2000 行。
Outcome(结果):如果愿望实现,我将对大数据分析的全流程有扎实的实践经验,能更自信地应对未来工作中的数据分析任务。看着自己从海量数据中挖掘出有价值的信息,并通过可视化清晰呈现,那种成就感会让我无比喜悦,也会坚定我在数据分析领域发展的信心。
Obstacles(障碍):
内部障碍:在处理大规模数据时,面对复杂的代码逻辑和报错,容易产生烦躁情绪,进而拖延任务;有时会因过于追求分析结果的完美,在某一环节花费过多时间,导致整体进度缓慢。比如在进行数据清洗时,会反复纠结于某几个异常值的处理方式,浪费大量时间。
外部障碍:课程实践项目的数据集可能存在质量问题(如数据缺失严重、格式不规范),导致分析工作难以推进;团队协作时,若成员对数据分析的理解和进度不一致,也会影响项目开展。
Plan(“if - then” 计划):
如果在处理大规模数据遇到复杂代码逻辑或报错而烦躁拖延,那么我会先暂停当前工作,去查阅类似问题的解决方案(如在 Stack Overflow 搜索报错信息),或者向同学、老师请教,同时给自己 5 分钟时间做深呼吸、放松心情,调整好状态后再继续。
如果因追求完美而在某一环节花费过多时间,那么我会先制定一个时间规划表,给每个分析环节设定明确的时间上限(如数据清洗最多 2 天),到时间后就进入下一个环节,若后续有时间再回头优化。
如果数据集质量差影响分析,那么我会先与团队成员或老师沟通,尝试获取更优质的数据集;若无法获取,就一起讨论制定合适的数据预处理策略,如选择合适的缺失值填充方法、异常值处理规则等,确保分析工作能继续开展。
如果团队协作中成员理解或进度不一致,那么我会组织团队会议,明确每个成员的任务和时间节点,建立每日简短的进度同步机制,及时解决出现的分歧与问题。
6、《大数据计算与应用》学习思维导图
7、提有质量的问题, 给认真的反馈
有问题就问,至少一学期提三个问题, 认真按时填写反馈。
8、监督措施
用博客记录自己的学习,将数据可视化的成果,定期分享到博客里,以此来监督自己在数据可视化创新性和交互性的提升。
加入数据分析学习小组,定期与小组成员分享自己的项目进展、遇到的问题,同时也了解他人的学习情况。