AI和机器学习路线图(数据分析)

部分引自DataWhale  https://datawhale.feishu.cn/docs/doccn0AOicI3LJ8RwhY0cuDPSOc#22v0JV

部分引自AILEARNING:   https://apachecn.gitee.io/ailearning/   https://github.com/apachecn/data
阿里天池:https://tianchi.aliyun.com/course?spm=5176.12281897.J_3941670930.5.4ab339a9jHfOps

数据分析基础

   数据分析的学习如果想要尽快进入实战,建议学习路线:

     1. python的基础编程 : python基础 、Pandas基础、Numpy基础

     2. 机器学习基础理论: 刚入门不建议太深入,深入的理论可以等课上学习,或者等有了基础概念和实战后再深学。当然,有时间的除外。推荐百度飞浆

    https://aistudio.baidu.com/aistudio/learnmap

    3. 简单理论+实践:算法很多不需要每一个都学习,几种典型算法看一下(分类和回归算法,决策树、线性回归、朴素贝叶斯、集成算法),每种算法都实践一次即可,实战中分类算法都差不多,大部分理论其实用不上,知道大概理论,知道怎么用就行。

      推荐阿里天池的

    4. 实战:这个特别重要,尤其是数据预处理以及算法的选择。实战遇到问题,不理解的地方回来再看理论。很多问题不需要深度的理论知识,知乎就够了。要更上一层楼的时候,可以深入看算法。

有余力的,想要系统性学习的,可以看吴恩达《机器学习》视频》,B站很多,网易云课堂也有。

 

注:其实飞浆和阿里都是对于学习路线图都设计得很好,学习材料也不错。但是飞浆主推它自己的Paddle框架,目前市面上的tensorflow、pytorch、keras都不能用,比较麻烦,但是平台速度真是良心,还提供免费GPU。上面的视频和入门还是非常不错的。

阿里天池基于开源框架,案例很多,也非常好,但是平台开启过程慢得怀疑人生,建议参考它的案例,在本地电脑上操作。

课程类型 

课程性质 

课程名 

课程资料 

必修

Python基础

  

聪明办法学Python

 

文字教程:https://github.com/datawhalechina/learn-python-the-smart-way

视频教程:https://www.bilibili.com/video/BV1hv411n7Yg

 

 AiLearning 相关

 

ailearning:https://apachecn.gitee.io/ailearning/#/docs/da/006

 

https://apachecn.gitee.io/ailearning/#/docs/da/063

 

百度飞浆--预备知识--python基础

(推荐)

https://aistudio.baidu.com/aistudio/learnmap

天池(推荐)

https://tianchi.aliyun.com/course/308?spm=5176.21206777.J_3641663050.2.1e9e17c9db9sAf

SQL基础

 

奇妙的SQL

文字教程:https://github.com/datawhalechina/wonderful-sql 

天池 SQL入门与实践

https://tianchi.aliyun.com/course/309?spm=5176.21206777.J_3641663050.3.1e9e17c9db9sAf

Excel基础

自由Excel

文字教程:https://github.com/datawhalechina/free-excel

视频教程:https://www.bilibili.com/video/BV1r64y1h75T

Pandas基础

Pandas数据处理与分析

文字教程:https://github.com/datawhalechina/joyful-pandas

配套教材:《Pandas入门与实践:Python数据处理与分析》 耿远昊. 人民邮电出版社

Numpy基础

巨硬的NumPy

文字教程:https://github.com/datawhalechina/powerful-numpy

aiLearning:https://apachecn.gitee.io/ailearning/#/docs/da/028

数据准备和特征工程

百度飞浆--预备知识--数据准备和特征工程

(推荐)

https://aistudio.baidu.com/aistudio/learnmap

机器学习理论

吃瓜教程

西瓜书公式较多,不推荐入门学习

文字教程:https://github.com/datawhalechina/pumpkin-book 

视频教程:https://www.bilibili.com/video/BV1Mh411e7VU

配套教材:《机器学习公式详解》 谢文睿,秦州. 人民邮电出版社

机器学习实践

西瓜书代码实战

文字教程:https://github.com/datawhalechina/machine-learning-toy-code

视频教程:https://www.bilibili.com/video/BV1w64y1x7Pi

数据分析理论&实践

动手学数据分析

文字教程:https://github.com/datawhalechina/hands-on-data-analysis 

简单理论+实践

 

aiLearn机器学习

https://apachecn.gitee.io/ailearning/#/docs/ml/1

天池(机器学习入门与实践)

https://tianchi.aliyun.com/course/310?spm=5176.21206777.J_3641663050.4.1e9e17c9db9sAf

选修

集成学习理论&实践

集成学习

文字教程:https://github.com/datawhalechina/ensemble-learning 

视频教程:https://www.bilibili.com/video/BV1R54y137Q5

数据可视化

(不需要专门学习

建议遇到问题时再看

matplotlib奇遇记

文字教程:https://github.com/datawhalechina/fantastic-matplotlib

 aiLeanring:https://apachecn.gitee.io/ailearning/#/docs/da/080

极好的Plotly

文字教程:https://github.com/datawhalechina/wow-plotly

视频教程:https://www.bilibili.com/video/BV1Df4y1A7aR

机器学习理论原理

钥匙书

文字教程:https://github.com/datawhalechina/key-book

实践

分类

零基础入门金融风控-贷款违约预测

赛题介绍:根据贷款申请人的数据信息预测其是否有违约的可能

教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl 

零基础入门数据挖掘-心跳信号分类预测

赛题介绍:根据心电图感应数据预测心跳信号

教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassification 

回归

零基础入门数据挖掘之二手车交易价格预测

赛题介绍:根据汽车类型等信息预测二手汽车的交易价格

教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/SecondHandCarPriceForecast 

综合

零基础入门数据分析之学术前沿趋势分析

赛题介绍:使用公开的arXiv论文完成对应的数据分析操作

教程地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/AcademicTrends 

数据竞赛Baseline & Topline分享

教程地址:https://github.com/datawhalechina/competition-baseline 

 

posted @ 2021-12-23 21:56  云2021  阅读(852)  评论(0)    收藏  举报