学习进度笔记25
摘要:《机器学习十讲》第十讲 强化学习 一、马尔可夫决策过程MDP 二、基于价值的方法 Q-Learning DQN 三、基于策略的方法 策略梯度算法 四、总结 机器学习——》微积分 、概率论、优化方法、统计学 ——》python、数据结构、数据库 数据采集、数据管理、数据清洗、数据可视化 深度学习、强化
阅读全文
posted @
2021-02-05 19:28
嘻嘻_嘻
阅读(62)
推荐(0)
学习进度笔记24
摘要:《机器学习十讲》第九讲 一、多层感知机 二、机器学习vs深度学习 三、典型网络结构 1、卷积神经网络CNN 卷积+池化 2、循环神经网络RNN 3、自编码器 4、生成对抗模型 四、实践案例:使用卷积神经网络进行人脸识别
阅读全文
posted @
2021-02-05 15:32
嘻嘻_嘻
阅读(48)
推荐(0)
学习进度笔记23
摘要:《机器学习十讲》第八讲 维度灾难 一、基于距离的机器学习模型受影响 计算复杂度:决策树 朴素贝叶斯 二、应对维度灾难 特征选择和降维 过度拟合与正则化 核技巧 三、案例:维度灾难的Python实践
阅读全文
posted @
2021-02-04 14:56
嘻嘻_嘻
阅读(55)
推荐(0)
学习进度笔记22
摘要:《机器学习十讲》第七讲 最优化 一、梯度下降的优化 动量法 Nesterov动量法 AdaGrad RMSProp Adam 二、二阶优化方法 牛顿法 三、优化算法的选择 四、案例:机器学习中常用优化算法的Python实践
阅读全文
posted @
2021-02-04 10:46
嘻嘻_嘻
阅读(48)
推荐(0)
学习进度笔记21
摘要:《机器学习十讲》第六讲 降维 一、降维 将数据的特征数量从高维转换到低维 二、主成分分析PCA(线性) 算法流程 三、自编码器(非线性) 四、Python降维实践工具 五、案例:Python降维实践及在特征脸、图像重构和文本数据中的应用
阅读全文
posted @
2021-02-03 13:32
嘻嘻_嘻
阅读(68)
推荐(0)
学习进度笔记20
摘要:《机器学习十讲》第五讲 聚类 一、聚类 将数据集中相似的样本进行分组,无监督学习方法 二、K-Means模型 固定c,优化r 固定r,优化c 算法流程 高斯混合模型GMM 求解 三、案例:K-Means的Python实现及在图像分割和新闻聚类中的应用
阅读全文
posted @
2021-02-03 10:16
嘻嘻_嘻
阅读(47)
推荐(0)
学习进度笔记19
摘要:《机器学习十讲》第四讲 模型提升 一、模型提升的方法 二、决策树 三、随机森林 算法流程 四、AdaBoost 五、实践案例
阅读全文
posted @
2021-01-31 14:09
嘻嘻_嘻
阅读(41)
推荐(0)
学习进度笔记18
摘要:《机器学习十讲》第三讲 分类 一、数学知识 1、点到直线的距离 2、梯度下降法 机器学习——随机梯度下降法 3、最大似然估计 二、分类 1、有监督学习;y为离散值 2、感知机、支持向量和逻辑回归 三、感知机 感知机算法 四、支持向量机 间隔最大化 样本损失函数 优化目标 五、逻辑回归 赋予样本概率解
阅读全文
posted @
2021-01-29 10:22
嘻嘻_嘻
阅读(60)
推荐(0)
学习进度笔记17
摘要:《机器学习十讲》第二讲 回归 numpy矩阵求逆函数 回归:一类预测变量为连续值的有监督学习方法。 一元线性回归:y=w1x+w0; 求解 多元线性回归 矩阵表示 模型求解 线性回归的问题 正则化 岭回归 岭迹分析 LASSO最小绝对值和选择算法 岭回归和LASSO 回归模型的评价指标 案例:使用回
阅读全文
posted @
2021-01-28 19:31
嘻嘻_嘻
阅读(69)
推荐(0)
学习进度笔记16
摘要:《机器学习十讲》第一讲 一、大数据:数据采集、数据清洗、数据分析和数据应用的整个流程中的理论、技术和方法。 机器学习:大数据分析的核心内容。找到将X和Y关联的模型F。 深度学习:机器学习的一部分,核心是自动找到对特定任务有效的特征,即自动完成Data到X的转换。 二、机器学习的方法 1、有监督学习
阅读全文
posted @
2021-01-27 15:39
嘻嘻_嘻
阅读(52)
推荐(0)
学习进度笔记15
摘要:TensorFlow双向循环神经网络 鉴于单向循环神经网络某些情况下的不足,提出了双向循环神经网络。因为是需要能关联未来的数据,而单向循环神经网络属于关联历史数据,所以对于未来数据提出反向循环神经网络,两个方向的网络结合到一起就能关联历史与未来了。 双向循环神经网络按时刻展开的结构如下,可以看到向前
阅读全文
posted @
2021-01-09 12:25
嘻嘻_嘻
阅读(78)
推荐(0)
学习进度笔记14
摘要:TensorFlow循环神经网络 RNN的网络结构及原理 RNNs包含输入单元(Input units),输入集标记为{x0,x1,...,xt,xt+1,...},而输出单元(Output units)的输出集则被标记为{y0,y1,...,yt,yt+1.,..}。RNNs还包含隐藏单元(Hid
阅读全文
posted @
2021-01-09 12:07
嘻嘻_嘻
阅读(113)
推荐(0)
学习进度笔记13
摘要:TnsorFlow多层感知机 多层感知机是由感知机推广而来,感知机学习算法(PLA: Perceptron Learning Algorithm)用神经元的结构进行描述的话就是一个单独的。 感知机(PLA)的神经网络表示如下: 从上述内容更可以看出,PLA是一个线性的二分类器,但不能对非线性的数据进
阅读全文
posted @
2021-01-09 11:36
嘻嘻_嘻
阅读(75)
推荐(0)
学习进度笔记12
摘要:TensorFlow K近邻算法 knn的基本原理: KNN是通过计算不同特征值之间的距离进行分类。 整体的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的
阅读全文
posted @
2021-01-09 11:18
嘻嘻_嘻
阅读(90)
推荐(0)
学习进度笔记11
摘要:TensorFlow逻辑回归 逻辑回归可以看作只有一层网络的前向神经网络,并且参数连接的权重只是一个值,而非矩阵。公式为:y_predict=logistic(X*W+b),其中X为输入,W为输入与隐含层之间的权重,b为隐含层神经元的偏置,而logistic为激活函数,一般为sigmoid或者tan
阅读全文
posted @
2021-01-09 11:11
嘻嘻_嘻
阅读(74)
推荐(0)
学习进度笔记10
摘要:Tensorflow线性回归 源代码: import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltimport osos.environ["CUDA_VISIBLE_DEVICES"]="0"#设置训练参数,lea
阅读全文
posted @
2021-01-09 11:00
嘻嘻_嘻
阅读(125)
推荐(0)
学习进度笔记9
摘要:tensorflow基本操作(类似numpy) 源代码 import tensorflow as tf import os os.environ["CUDA_VISIBLE_DEVICES"]="0" #构造计算图,创建两个常量节点a,b,值分别为2,3 a=tf.constant(2) b=tf.
阅读全文
posted @
2021-01-09 10:23
嘻嘻_嘻
阅读(115)
推荐(0)
学习进度笔记8
摘要:今天完成spark实验7:Spark机器学习库MLlib编程实践。 1、数据导入 从文件中导入数据,并转化为 DataFrame。 //导入需要的包 import org.apache.spark.ml.feature.PCA import org.apache.spark.sql.Row impo
阅读全文
posted @
2021-01-08 17:55
嘻嘻_嘻
阅读(1462)
推荐(0)
学习进度笔记7
摘要:今天完成spark实验6:Spark Streaming编程初级实践。 1、安装Flume Flume 是 Cloudera 提供的一个分布式、可靠、可用的系统,它能够将不同数据源的海量 日志数据进行高效收集、聚合、移动,最后存储到一个中心化数据存储系统中。Flume 的 核心是把数据从数据源收集过
阅读全文
posted @
2021-01-07 13:18
嘻嘻_嘻
阅读(382)
推荐(0)
学习进度笔记6
摘要:今天完成spark实验5:Spark SQL编程初级实践。 1、Spark SQL基本操作 将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。 { "id":1 , "name":" Ella" , "age":36 } { "id":2, "name"
阅读全文
posted @
2021-01-06 21:06
嘻嘻_嘻
阅读(573)
推荐(0)