人工智能学习(上)

1.机器学习算法总览

image-20230608095351239

2.人工智能学习步骤

1)AI数学基础:https://tianchi.aliyun.com/course/277?spm=a2c22.21206777.J_7877492310.14.2b7f17c9f0sQhp

2)机器学习基本算法:https://tianchi.aliyun.com/course/278?spm=a2c22.21206777.J_7877492310.18.2b7f17c9f0sQhp

3)Pytorch机器学习框架实战:https://tianchi.aliyun.com/course/337?spm=a2c22.21206777.J_7877492310.6.2b7f17c9f0sQhp

4)深度学习原理:https://tianchi.aliyun.com/course/279?spm=a2c22.21206777.J_7877492310.7.2b7f17c9f0sQhp

5)NLP项目实战:部署,微调,Lora训练等等

3.学习笔记

3.1 AI数学基础(上)

3.1.0 数学符号大全

image-20230613163718663

image-20230613163739645

image-20230613163755815

3.1.1 机器学习所需的数学知识

  • 微积分
  • 线性代数
  • 概率论
  • 最优化方法

image-20230609135522997

3.1.2 算法所用到的数学知识点

image-20230609140045647


3.1.3 导数

image-20230609141313548

image-20230609141338835

image-20230609141417741

image-20230609141444557

  • 总结⭐⭐

例题求解:f(x) = log(1+x2+e2x)


3.1.4 高阶导数

image-20230609141700677

  • 总结⭐⭐

例题求解:5x4求二阶导数


3.1.5 导数与函数的性质

image-20230609142045996

  • 总结⭐⭐

1)单调性:f‘(x) >0 往上,f'(x)<0往下

2)极值:f'(x)=0,极值必要条件

  1. 从下往上看,看凹凸性;函数的二阶导数决定凹凸性,f''(x) >0 凸函数

3.1.6 一元函数的泰勒展开

image-20230609142945667


3.1.7 向量

image-20230609144046979

image-20230609144246804

  • 向量的内积

image-20230609144349467

image-20230609144712031

  • 总结⭐⭐

1)行列向量

2)向量的运算

3)向量的范数


3.1.8 矩阵

image-20230609144923133

image-20230609145724511

image-20230609145908226

image-20230609150105199

image-20230609151824721

  • 总结⭐⭐

1)方阵,对称矩阵,单位矩阵,对角线矩阵的概念

2)矩阵的运算:加减法,数乘,转置

3)逆矩阵


3.1.9 行列式


3.1.10 偏导数

image-20230609153629358

image-20230609154022038

  • 总结⭐⭐

f(x,y) = x2 + xy - y2分别求x,y的偏导数


3.1.11 高阶偏导数

image-20230609155818662

image-20230609155155108


3.1.12 梯度

image-20230609155735618


3.1.13 雅可比矩阵

image-20230609160522589

  • 总结⭐⭐

例题求解:u,v --> x,y,z


3.1.14 Hessian矩阵

image-20230609161037879

  • 总结⭐⭐

例题求解:f(x,y,z) = 2x2 - xy + y2 -3z2


3.1.15 极值判别法则

image-20230609161230344

image-20230609161504554


3.1.16 二次型

image-20230609162740789


3.1.17 特征值与特征向量⭐⭐⭐

image-20230612085811084

  • 总结⭐⭐

特征值和特征向量被用于多种算法


3.1.18 特征值分解

image-20230612090037348

  • 总结⭐⭐

3.1.19 多元函数的泰勒展开

image-20230612090237051

  • 总结⭐⭐

3.1.20 矩阵和向量的求导公式⭐⭐

image-20230612090417918

image-20230612090522143

image-20230612090843429

image-20230612091137698

总结⭐⭐


3.1.21 奇异值求解(了解)

image-20230612091403901


3.1.22 为什么需要概率⭐⭐

image-20230612091543142

总结⭐⭐


3.1.23 随机事件与概率

image-20230612091803581

总结⭐⭐


3.1.24 条件概率与贝叶斯公式⭐⭐

image-20230612092035886

总结⭐⭐


3.1.25 随机事件的独立性

image-20230612092224891

总结⭐⭐


3.1.26 随机变量⭐⭐

image-20230612093308753

总结⭐⭐


3.1.27 数学期望和方差⭐⭐

image-20230612093628259

3.1.28 常用的概率分布⭐⭐

image-20230612093841852

总结⭐⭐


3.1.29 随机向量

image-20230612093939241

image-20230612094048178

image-20230612094144392

总结⭐⭐


3.1.30 随机变量的独立性

image-20230612094256674

总结⭐⭐


3.1.31 协方差

反映变量线性相关程度

image-20230612094522140

3.1.32 常用的多维概率分布

image-20230612094705375

总结⭐⭐


3.1.33 最大似然估计⭐⭐

image-20230612094946471

3.1.34 总结⭐⭐

image-20230612095152604



-------

3.2 AI数学基础(下)

3.2.0 内容简介

image-20230612095438148

3.2.1 最优化的基本概念

image-20230612095825459

3.2.2 为什么要用迭代法

image-20230612100237907

总结⭐⭐

3.2.3 梯度下降法⭐⭐

image-20230612100603999

image-20230612100807068

image-20230612100918252

image-20230612101207448


3.2.4 牛顿法

image-20230612101812996

image-20230612102220449


3.2.5 坐标下降法

image-20230612102505536


3.2.6 优化算法面临的问题

image-20230612102854697


3.2.7 拉格朗日乘数法

image-20230612103107338


3.2.8 凸优化简介

image-20230612103234774


3.2.9 凸集

image-20230612103502024

image-20230612103706595


3.2.10 凸函数

image-20230612104114257


3.2.11 凸优化的性质

image-20230612104552148


3.2.12 凸优化的一般表

image-20230612104808318


3.2.13 拉格朗日对偶

image-20230612105629281

image-20230612110155730

image-20230612110412564

3.2.14 KKT条件

image-20230612110619467


3.2.15 总结⭐⭐

image-20230612111537844


3.3 LeeCode编程基础课

3.3.1 线性结构

1)数组

image-20230612112115396

image-20230612112318643

image-20230612112516750

image-20230612112647941

image-20230612143704750

image-20230612143722170

image-20230612143734661

2)链表

image-20230612143822533

image-20230612143835283

image-20230612143855342

image-20230612143919804

image-20230612143932434

image-20230612143946108

image-20230612143958043

image-20230612144016297

image-20230612144033520

image-20230612144046438

image-20230612144058630

image-20230612144106934

3)栈

image-20230612144135772

image-20230612144154053

image-20230612144210415

image-20230612144222609

image-20230612144231384

image-20230612144254946

image-20230612144307740

image-20230612144323061

image-20230612144339052

image-20230612144403077

image-20230612144413311

image-20230612144424458

image-20230612144441267

image-20230612144458717

image-20230612144516081

image-20230612144533528

image-20230612144548671

image-20230612144603293

image-20230612150631852

image-20230612150658099

image-20230612150708088

image-20230612150720528

4)字符串

image-20230612150812294

image-20230612150822541

image-20230612150838076

image-20230612150848885

image-20230612150902031

image-20230612150920067

image-20230612150938552

image-20230612150954271

image-20230612151006601

image-20230612151017509

image-20230612151032125

image-20230612151042603

image-20230612151053332

image-20230612151106029

image-20230612151115689

image-20230612151133278

image-20230612151143161

image-20230612151154778

image-20230612151208128

image-20230612151221732

image-20230612151232487

image-20230612151241902

image-20230612151252844

image-20230612151309863

image-20230612151322036

image-20230612151332946

image-20230612151346120

image-20230612151402266

image-20230612151415673

image-20230612151427342

image-20230612151436608

image-20230612151446700

image-20230612151502515

image-20230612151511554

image-20230612151520887

image-20230612151529413

image-20230612151539498

image-20230612151550645

image-20230612151600744

image-20230612151609685

image-20230612151644476


3.3.2 树性机构

1)树

image-20230612152342749

image-20230612151733715

image-20230612151749852

image-20230612151802469

image-20230612151812919

image-20230612151832854

image-20230612151855073

image-20230612151906019

image-20230612151920388

image-20230612151955913

image-20230612152012056

image-20230612152031927

image-20230612152258518

image-20230612152359522

image-20230612152412112

image-20230612152426550

image-20230612152436896

image-20230612152448472

image-20230612152531491

image-20230612152648228

image-20230612152702241

image-20230612152712997

image-20230612152730403

image-20230612152739882

image-20230612152758676

image-20230612152818033

image-20230612152833792

image-20230612152848778

image-20230612152855605

image-20230612152914328

image-20230612152956206

image-20230612153013780

image-20230612153029063

image-20230612153042170

image-20230612153057305

image-20230612153114996

image-20230612153131093

image-20230612153145540

image-20230612153155549

image-20230612153218295

image-20230612153236558

image-20230612153645283

image-20230612153703323

image-20230612153714024

image-20230612153728577

image-20230612153740842

image-20230612153757646

image-20230612153807836

image-20230612153817015


  • 技巧
    • 位运算
    • 双指针

  • 算法
    • 搜索
    • 排序
    • 动态规划
    • 分治

  • 散列表
    • 哈希表

3.3 机器学习基本算法

3.3.1 本集简介

image-20230612154027366

3.3.2 推荐的参考书

image-20230612154159912

3.3.3 人工智能简介

image-20230612154752703

image-20230612154806135

3.4 Pytorch机器学习框架实战

3.5 深度学习原理

3.5.1 深度学习崛起

image-20230612160902728

image-20230612160921744

image-20230612160943062

image-20230612161002068

image-20230612161011800

image-20230612161021568

image-20230612161038118

image-20230612161104477

image-20230612161129545

image-20230612161159198

image-20230612161224043

image-20230612161311517

image-20230612161235831

image-20230612161251598

image-20230612161507745

image-20230612161519898

image-20230612161540030

image-20230612161706944

image-20230612161724862

image-20230612161805100

image-20230612161855612

image-20230612162058258

image-20230612162319726

image-20230612162331522

image-20230612162436356

image-20230612162537699

image-20230612162616528

image-20230612162813692

image-20230612162917623

image-20230612163028916

image-20230612163157606

3.5.2 深度学习典型应用与研究方向之语音处理

image-20230612171612933

image-20230612171623102

image-20230612171646432

image-20230612171707600

image-20230612172018425

image-20230612172049510

image-20230612172522303

image-20230612172534146

image-20230613085709415

image-20230613085728451

image-20230613085755013

3.5.3 深度学习典型应用与研究方向之计算机视觉

image-20230613085901393

image-20230613085915791

image-20230613091910879

image-20230613092221280

image-20230613092246255

image-20230613092310075

image-20230613092336580

image-20230613092411730

image-20230613092603776

image-20230613092902172

image-20230613092933794

image-20230613093029770

image-20230613093105747

image-20230613093214618

image-20230613093321039

image-20230613094822811

image-20230613094847200

image-20230613094921665

3.5.4 深度学习典型应用与研究方向之自然语言处理

image-20230613095052557

image-20230613095127007

image-20230613095341525

image-20230613095536201

image-20230613095623790

image-20230613095826235

image-20230613103356036

image-20230613103421251

image-20230613103503015

image-20230613103625540

image-20230613103712144

image-20230613103919439

3.5.5 深度学习典型应用与研究方向之推荐系统

image-20230613104424556

image-20230613104448286

image-20230613104525183

image-20230613104542284

image-20230613104601618

image-20230613104633964

image-20230613104659260

image-20230613104731298

image-20230613104802311

image-20230613104821814

image-20230613104837777

image-20230613104912853

image-20230613104935499

3.5.6 神经网络(上)

image-20230613105051562

image-20230613105102496

image-20230613105300172

image-20230613105427246

image-20230613105651209

image-20230613110037208

image-20230613110055315

image-20230613110258637

image-20230613110448025

总结⭐⭐

  • 通过调整权重和偏置,实现不同的数学逻辑
  • image-20230627094525187

image-20230613110844370

image-20230613111100170

image-20230613111533171

image-20230613112003283

3.5.7 神经网络(下)

image-20230613112313731

image-20230613112333403

image-20230613112346861

image-20230613112459981

image-20230613112823034

image-20230613144058976

image-20230613144226661

image-20230613144517900

image-20230613144737681

image-20230613144954580

image-20230613145339732

image-20230613145653156

image-20230613145710082

image-20230613145920863

image-20230613150114389

总结⭐⭐⭐⭐:

1)生物学背景

2)单层感知器

3)多层感知器

4)单,多层感知器核心的求解方法,梯度下降法,反响传播理论

3.5.8 卷积神经网络(上)

image-20230613150726949

image-20230613150747593

image-20230613150807537

image-20230613151600055

image-20230613151924947

image-20230613152209456

image-20230613152336775

image-20230613152738753

image-20230613152835477

总结⭐⭐⭐⭐:

1)传统神经网络学习,有监督的机器学习

2)卷积神经网络学习,无监督的深度学习,特征和分类结合,取消了人工设计特征的流程

image-20230613153105043

image-20230613153118631

image-20230613153848426

image-20230613154011517

image-20230613154143579

image-20230613154405245

image-20230613155611180

总结⭐⭐⭐⭐:

训练中需要调整的参数:

1)输入的尺寸

2)padding 卷积前,给边界额外输入的行列

  1. 步长,step,输入输出大小计算

image-20230613160611636

image-20230613160940548

image-20230613161211406

image-20230613161432912

image-20230613161739006

3.5.9 卷积神经网络(下)

image-20230613161948532

image-20230613162003140

image-20230613162323039

image-20230613162812032

image-20230613163113730

image-20230613163843056

image-20230613163859657

image-20230613164105835

image-20230613171449757

image-20230614090006091

image-20230614090120309

image-20230614090301941

总结⭐⭐⭐⭐:

1)ReLU激活函数,加快模型收敛,不同与lenet的激活函数

2)裁减翻转,数据增强策略

3)依赖于GPU发展,数据集发展,工程技巧的三个背景


总结⭐⭐⭐⭐:

1)卷积神经工程的反向传播

2)两个具有代表性的卷积神经网络模型


3.5.10 深度学习优化之激活函数与参数初始化

image-20230614090905862

image-20230614090931791

image-20230614091150731

总结⭐⭐⭐⭐:

1)阶跃函数

2)ieLU激活函数

3)S型激活函数

image-20230614091553510

image-20230614091834821

image-20230614091851722

image-20230614092215464

image-20230614092541929

image-20230614092914847

image-20230614093029514

image-20230614093145716

image-20230614093304611

image-20230614093348419

image-20230614093359566

image-20230614093608965

image-20230614093801785

image-20230614094042294

image-20230614094254378

image-20230614094607165

总结⭐⭐⭐⭐:

1)好的初始化,对深度学习至关重要

2)大型模型训练,使用预训练好的模型进行初始化,预训练+微调


3.5.11 深度学习优化之标准化与池化

image-20230614095157241

image-20230614095207525

image-20230614095444108

image-20230614095804743

image-20230614095846981

image-20230614100021480

image-20230614100230897

image-20230614100319115

image-20230614100351916

image-20230614100401224

image-20230614100553159

image-20230614100622213

image-20230614100647879

image-20230614100707598

总结⭐⭐⭐⭐:

1)带步长的卷积替代池化的操作

2)归化/标准化,有助于调整数据分布,有助于模型更好,更快的训练

3)池化在模型训练中,是一种必要的操作,提供泛化的能力


3.5.12 深度学习优化之泛化与正则化

image-20230614101037687

image-20230614101044135

image-20230614101058507

总结⭐⭐⭐⭐:

欠拟合:模型没有得到较好的训练,没有办法拟合数据集,模型表达能力还不行

过拟合:模型学习的太过了,对真实的数据表现不好;在训练集中,误差几乎没有,但曲线过于复杂,面对新数据时,判断会出现误差

好的模型需要控制训练的程度,处于欠拟合和过拟合之间

image-20230614101824337

范化能力的评估,让人工智能更趋近于人的行为模式

因为,一般情况下,人不可能完全正确,对事务的认识,不会具体的很精细的程度

就比如对图片,不会因为一个像素的改变而对其判断错误

image-20230614102247943

正则化方法:增强模型的泛化能力

image-20230614102318642

image-20230614102539752

image-20230614102801457

image-20230614102929560

image-20230614103117382

image-20230614103251793

image-20230614103546793

image-20230614104024261

image-20230614104034324

总结⭐⭐⭐⭐:

1)模型的泛化,模型的泛化能力的影响,以及如何增强模型泛化能力


3.5.13 深度学习优化之最优化

image-20230614104351890

image-20230614104400698

image-20230614104411349

image-20230614104529137

深度学习模型,具有很多的局部最小值,且性能相近

对深度学习模型的优化,其实就是找到性能不错的局部最小值,但局部最小值很多,优化起来有一定难度

image-20230614104820462

image-20230614105042437

选择合适的学习率,才能在合适的时间里,对模型进行优化

image-20230614105340593

image-20230614105354223

image-20230614105437527

image-20230614105640870

image-20230614105947303

image-20230614110051663

image-20230614110129823

image-20230614110202827

image-20230614110238594

image-20230614110327562

image-20230614110337020

image-20230614110422719

总结:

1)最优化基本概念,常见最优化算法,以及一些思考


3.5.14 深度学习优化之优化目标与评估指标

image-20230614110544550

image-20230614110553183

image-20230614110603914


通过损失函数,判断模型的训练状态⭐⭐⭐⭐⭐⭐⭐⭐


image-20230614110726839

image-20230614110858890

image-20230614110953600

image-20230614111137631

image-20230614111448476

image-20230614111839715

image-20230614112022824

image-20230614112215254

image-20230614112308894

image-20230614112322015

image-20230614112409142

image-20230614112805590

image-20230614112927357

image-20230614112958003

image-20230614113032648

image-20230614134327893

image-20230614134403620

image-20230614134448442

总结:

1)分类,回归任务中的常见损失函数和常见的评估指标


3.5.15 深度学习优化之数据增强

image-20230614134644764

image-20230614134656950

image-20230614134707548

image-20230614134737751

image-20230614134935457

image-20230614134954441

image-20230614135152463

image-20230614135203590

image-20230614135221825

image-20230614135317212

image-20230614135427845

image-20230614135516675

image-20230614135840688

image-20230614135852014

总结

1)数据增强的重要性

2)数据增强的经典方法

3)自动增强的数据增强方法


3.5.16 深度学习框架之Pytorch快速入门与实践

image-20230614140205645

image-20230614140217574

image-20230614140231752

image-20230614140405687

image-20230614140517995

image-20230614140551241

image-20230614140712235

image-20230614141649181

image-20230614141928056

总结:

1)知道哪些需要反向传播

2)知道哪些需要计算梯度

image-20230614143238149

image-20230614145424187

image-20230614150416177

image-20230614152014891

image-20230614152303975

总结:

1)scale:缩放;RandomSizedCrop:随机裁减;RandomHorizontalFlip:随机翻转

2)ToTensor:转换为Tensor格式

3)Normalize:标准化函数

image-20230614153128222

image-20230614153640861

image-20230614153701735

image-20230614153920730

image-20230614154014617

image-20230614154149095

image-20230614154745019

image-20230614154918441

具体步骤:

1)数据预处理

2)网络定义

3)优化目标和方法

4)训练迭代

5)可视化

6)测试


3.5.17 深度学习框架之Caffe快速入门与实践

image-20230614163437241

image-20230614163453397

image-20230614163515070

image-20230614163547631

image-20230614163627955

image-20230614163653792

image-20230614163712183

image-20230614163730352

image-20230614163750268

image-20230614163806417

image-20230614163819964

image-20230614163836526

image-20230614163850997

image-20230614163904255

image-20230614163926040

image-20230614163943279

image-20230614164000407

image-20230614164016762

image-20230614164042677

image-20230614164054126

image-20230614164104162

image-20230614164121110

image-20230614164151743

image-20230614164207050

image-20230614164224814

image-20230614164240984

总结:

1)自定义caffe网络层需要深入学习


3.5.18 深度学习框架之Tensorflow快速入门与实践

image-20230614164512859

image-20230614164523750

image-20230614164535850

image-20230614164644793

image-20230614164710873

总结:keras神经网络,抽象层级高,使用简单,但是不适合构建深度的神经网络

image-20230614165029152

image-20230614165042424

image-20230614165229225


图中w,x称为数据,multiple称为算子


image-20230614165546832

image-20230614165826559

image-20230614170306124

image-20230614170453265

image-20230614170711662

image-20230614170927223

image-20230614171058071

image-20230614171132615

image-20230614171212541

image-20230614171304498

image-20230614171319332

image-20230614171329193

image-20230614171410991

image-20230614171448173

image-20230614171508291

image-20230614171552067

image-20230614171625492

image-20230614171646494


3.5.19 从零完成人脸表情分类任务⭐⭐⭐⭐

image-20230614171853454

image-20230614171906091

image-20230614171918221

image-20230614172129622

image-20230614172222789

image-20230614172339115

image-20230614172349536

image-20230614172436291

image-20230614172505892

image-20230614172534589

image-20230614172623858

image-20230614172714912

image-20230615090544681

image-20230615090641107

image-20230615090738514

image-20230615090746868

image-20230615090949367

image-20230615091051831

image-20230615091203573

image-20230615091336189

image-20230615091438515

总结⭐⭐⭐⭐:

可以在AI训练营中进行训练


3.5.20 循环神经网络之RNN及其改进

image-20230615092256026

image-20230615092307401

image-20230615092329078

image-20230627105102686

image-20230615093055713

image-20230615093410925

image-20230615093634773

image-20230615093645083

image-20230615093935255

image-20230615094120228

image-20230615094211558

image-20230615094227637

image-20230615094258585

总结:

1)RNN的基本结构

2)RNN的优化,赶紧,LSTM

3)RNN可以完成的任务

4)更加复杂的数据神经网络,双向循环神经网络,深度循环神经网络


3.5.21 图神经网络基础

image-20230615094844854

image-20230615094850352

image-20230615094901637

image-20230615094949863

image-20230615103808757

image-20230615103820999

image-20230615103933842

image-20230615104022390

image-20230615104114533

image-20230615104158067

image-20230615104259626

image-20230615104348258

image-20230615104418567

image-20230615104927052

image-20230615104955819

总结:

1)图数据应用,图的基本表示

2)图在频域的定义,在空域的定义

3)图滤波的操作,基于图率波定义图卷积操作,基于图卷积,定义图神经网络


3.5.22 模型设计之网络宽度和深度设计

image-20230615105517494

image-20230615105529654

image-20230615105538578

image-20230615105811775

image-20230615110001314

image-20230615110120370

image-20230615110346494

image-20230615110516348

image-20230615110527984

image-20230615110754630

image-20230615111051065

image-20230615111308691

image-20230615111541680

image-20230615111907574

image-20230615111938373

image-20230615112101388

image-20230615112220660

image-20230615112234658

image-20230615112627962

image-20230615134817012

image-20230615134913775

优先深度,90%-95%,深度提升性能有限,更进一步可以选择提升宽度;刚开始粗调提升深度,细条提升宽度⭐⭐


3.5.23 模型设计之残差网络

image-20230615135511871

image-20230615135529129

image-20230615135541299

image-20230615135707009

image-20230615135900961

image-20230615140049467

image-20230615140301382

image-20230615141158038

image-20230615141225109

image-20230615141324020

image-20230615140935716

image-20230615141836425

image-20230615142359516

image-20230615142858049

image-20230615142914839

image-20230615143059058

image-20230615143320649

image-20230615144112607

image-20230615144222853

image-20230615144556401

总结:

1)残差网络设计思想,有效性解释,不同结构的残差网络

2)变种残差网络,残差网络与其他思想的结合


3.5.24 模型设计之分组网络

image-20230615145042412

image-20230615145052727

image-20230615145106256

image-20230615145330555

image-20230615145445660

image-20230615145621137

image-20230615145711647

image-20230615145940315

image-20230615145952870

image-20230615150211584

image-20230615150405904

image-20230615150430500

image-20230615150451094

image-20230615150510723

image-20230615150547689

image-20230615150617258

image-20230615150626232

image-20230615150718977

image-20230615150748322

总结:

1)通道分组的概念

2)不同的分组的策略

3)不同的分组设计思想,基于通道分组的模型设计

4)通道分组,是模型设计中一种重要的策略


3.5.25 模型设计之卷积核设计

image-20230615151022925

image-20230615151036283

image-20230615151046107

image-20230615151415203

3.6 NLP项目实战础

posted @ 2023-07-03 10:49  付十一。  阅读(21)  评论(0)    收藏  举报