第一次作业
大家好,我叫宋铭轩,是数据科学与大数据技术专业的一名学生。
(一)已具备的专业知识和能力
当前已具备的基础能力核心编程语言基础:熟练掌握 Python、Java、C++ 三种大数据领域常用编程语言的基础语法,能独立完成基础算法实现和简单控制台程序开发,理解面向对象编程的基础概念,可在 Java、C++ 中实现简单的类设计与调用。了解 Hadoop 生态的核心组件基本概念,能在 Linux 环境下完成 Hadoop 伪分布式集群的基础搭建,实现数据在 HDFS 中的上传、下载,以及通过 MapReduce 完成简单的词频统计任务,对大数据处理的基本流程有初步认知。掌握 MySQL 数据库的基础语法,能独立完成单表的增删改查操作,熟悉多表联查的逻辑与实现,会创建普通索引优化简单查询的速度,能够将数据库知识应用于简单场景。能用 Python 的 Pandas 库完成数据的基础清洗和简单统计,遇到技术问题,能通过 CSDN等平台查找解决方案,看懂基础技术博客,具备自主学习的初步能力。
(二)技术偏好
我对人工智能与业务场景深度融合方向兴趣浓厚,尤其关注 AI 如何从 “技术工具” 转化为 “可落地的价值引擎” 比如通过机器学习模型挖掘用户潜在需求、优化供应链库存周转效率,或利用计算机视觉技术提升制造业质检精度与效率。未来希望深入学习深度学习框架,自然语言处理(N与计算机视觉核心算法,结合业务数据分析能力,将 AI 模型的预测、分类、生成能力与企业实际需求结合,为产品创新、运营提效、风险管控等决策提供更智能、更具前瞻性的支撑,成为 “能让 AI 技术解决实际问题” 的专业人才.
(三)缺少的能力
神经网络基础结构,包括 CNN 卷积神经网络、RNN/LSTM 循环神经网络,掌握 TensorFlow、PyTorch 框架的基础使用,特征提取文本数据用 TF-IDF、Word2Vec;时间序列用滑动窗口统计、特征筛选。
(四)未来规划与本学期规划
完成 2-3 个小型实战项目:例如 “基于用户行为数据的商品推荐模型”“简单图像识别”“文本情感分析”,将技术与具体场景结合,积累项目开发经验;
(五)代码量相关情况
Python:约 3000行,预计本学期10000
(六)学习时间安排与课程目标
晨间 30 分钟:快速回顾前一日核心知识点,包括 Python 数据科学库语法、机器学习算法公式,用思维导图梳理逻辑关联,强化记忆的同时建立知识框架,午间 1 小时:聚焦 Python 数据科学基础实操,学习 Pandas 的缺失值填充,异常值处理,NumPy 的矩阵运算。晚间 2 小时前 1 小时跟随 《Machine Learning》课程,逐个突破线性回归、逻辑回归、决策树、随机森林、SVM 等基础算法,重点理解原理与适用场景,后 1 小时用 Scikit-learn 复现算法,对比不同参数对模型结果的影响,记录实验结论;每周补充:周六上午集中解决本周代码问题,整理成 “问题手册”,标注解决方案与原理。