AI和机器学习路线图(数据分析)
部分引自DataWhale https://datawhale.feishu.cn/docs/doccn0AOicI3LJ8RwhY0cuDPSOc#22v0JV
数据分析基础
数据分析的学习如果想要尽快进入实战,建议学习路线:
1. python的基础编程 : python基础 、Pandas基础、Numpy基础
2. 机器学习基础理论: 刚入门不建议太深入,深入的理论可以等课上学习,或者等有了基础概念和实战后再深学。当然,有时间的除外。推荐百度飞浆
https://aistudio.baidu.com/aistudio/learnmap
3. 简单理论+实践:算法很多不需要每一个都学习,几种典型算法看一下(分类和回归算法,决策树、线性回归、朴素贝叶斯、集成算法),每种算法都实践一次即可,实战中分类算法都差不多,大部分理论其实用不上,知道大概理论,知道怎么用就行。
推荐阿里天池的
4. 实战:这个特别重要,尤其是数据预处理以及算法的选择。实战遇到问题,不理解的地方回来再看理论。很多问题不需要深度的理论知识,知乎就够了。要更上一层楼的时候,可以深入看算法。
有余力的,想要系统性学习的,可以看吴恩达《机器学习》视频》,B站很多,网易云课堂也有。
注:其实飞浆和阿里都是对于学习路线图都设计得很好,学习材料也不错。但是飞浆主推它自己的Paddle框架,目前市面上的tensorflow、pytorch、keras都不能用,比较麻烦,但是平台速度真是良心,还提供免费GPU。上面的视频和入门还是非常不错的。
阿里天池基于开源框架,案例很多,也非常好,但是平台开启过程慢得怀疑人生,建议参考它的案例,在本地电脑上操作。
|
课程类型 |
课程性质 |
课程名 |
课程资料 |
|
必修 |
Python基础 |
聪明办法学Python
|
文字教程:https://github.com/datawhalechina/learn-python-the-smart-way 视频教程:https://www.bilibili.com/video/BV1hv411n7Yg
|
| AiLearning 相关 |
ailearning:https://apachecn.gitee.io/ailearning/#/docs/da/006
https://apachecn.gitee.io/ailearning/#/docs/da/063
|
||
|
百度飞浆--预备知识--python基础 (推荐) |
https://aistudio.baidu.com/aistudio/learnmap |
||
|
天池(推荐) |
https://tianchi.aliyun.com/course/308?spm=5176.21206777.J_3641663050.2.1e9e17c9db9sAf |
||
|
SQL基础
|
奇妙的SQL |
||
|
天池 SQL入门与实践 |
https://tianchi.aliyun.com/course/309?spm=5176.21206777.J_3641663050.3.1e9e17c9db9sAf |
||
|
Excel基础 |
自由Excel |
文字教程:https://github.com/datawhalechina/free-excel 视频教程:https://www.bilibili.com/video/BV1r64y1h75T |
|
|
Pandas基础 |
Pandas数据处理与分析 |
文字教程:https://github.com/datawhalechina/joyful-pandas 配套教材:《Pandas入门与实践:Python数据处理与分析》 耿远昊. 人民邮电出版社 |
|
|
Numpy基础 |
巨硬的NumPy |
文字教程:https://github.com/datawhalechina/powerful-numpy aiLearning:https://apachecn.gitee.io/ailearning/#/docs/da/028 |
|
|
数据准备和特征工程 |
百度飞浆--预备知识--数据准备和特征工程 (推荐) |
https://aistudio.baidu.com/aistudio/learnmap |
|
|
机器学习理论 |
吃瓜教程 (西瓜书公式较多,不推荐入门学习) |
文字教程:https://github.com/datawhalechina/pumpkin-book 视频教程:https://www.bilibili.com/video/BV1Mh411e7VU 配套教材:《机器学习公式详解》 谢文睿,秦州. 人民邮电出版社 |
|
|
机器学习实践 |
西瓜书代码实战 |
文字教程:https://github.com/datawhalechina/machine-learning-toy-code 视频教程:https://www.bilibili.com/video/BV1w64y1x7Pi |
|
|
数据分析理论&实践 |
动手学数据分析 |
文字教程:https://github.com/datawhalechina/hands-on-data-analysis |
|
|
简单理论+实践
|
aiLearn机器学习 |
||
|
天池(机器学习入门与实践) |
https://tianchi.aliyun.com/course/310?spm=5176.21206777.J_3641663050.4.1e9e17c9db9sAf |
||
|
选修 |
集成学习理论&实践 |
集成学习 |
文字教程:https://github.com/datawhalechina/ensemble-learning 视频教程:https://www.bilibili.com/video/BV1R54y137Q5 |
|
数据可视化 (不需要专门学习 建议遇到问题时再看) |
matplotlib奇遇记 |
文字教程:https://github.com/datawhalechina/fantastic-matplotlib aiLeanring:https://apachecn.gitee.io/ailearning/#/docs/da/080 |
|
|
极好的Plotly |
文字教程:https://github.com/datawhalechina/wow-plotly 视频教程:https://www.bilibili.com/video/BV1Df4y1A7aR |
||
|
机器学习理论原理 |
钥匙书 |
文字教程:https://github.com/datawhalechina/key-book |
|
|
实践 |
分类 |
零基础入门金融风控-贷款违约预测 |
赛题介绍:根据贷款申请人的数据信息预测其是否有违约的可能 教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl |
|
零基础入门数据挖掘-心跳信号分类预测 |
赛题介绍:根据心电图感应数据预测心跳信号 教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification |
||
|
回归 |
零基础入门数据挖掘之二手车交易价格预测 |
赛题介绍:根据汽车类型等信息预测二手汽车的交易价格 教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/SecondHandCarPriceForecast |
|
|
综合 |
零基础入门数据分析之学术前沿趋势分析 |
赛题介绍:使用公开的arXiv论文完成对应的数据分析操作 教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends |
|
|
数据竞赛Baseline & Topline分享 |
教程地址:https://github.com/datawhalechina/competition-baseline |

浙公网安备 33010602011771号