随笔分类 - 吴恩达机器学习
摘要:如何开发组合一个复杂的机器学习系统 ? 如何分配资源决定下一步怎么做? 001. Photo OCR Photo OCR stands for Photo Optical Character Recognition. 设计一个机器学习系统,其中一项最重要的决定就是要怎么样组织好这个流水线pipeli
阅读全文
摘要:得到一个高效的机器学习的方式之一: “用一个low bias的模型,然后用很大数据训练它” -- Andrew Ng 001. 先用确定是否用全数据集进行训练 右边的图High bias,增加再多训练数据也没用 002. 随机梯度下降 - Stochastic Gradient Descent Ba
阅读全文
摘要:001. 符号系统 以电影评分为例, 002. 基于内容的推荐 每个人对不同内容电影的打分都是有规律的,可以通过机器学习表示出来,这里用逻辑回归来描述。 因此总体而言,每个人都有一个独立的逻辑回归模型,模型的输入特征,则是内容产品的特征向量。 003. 基于内容的推荐系统优化函数 单个人的逻辑回归参
阅读全文
摘要:001. SVM的优化目标及损失函数 跟其他直接从margin出发不同,这里从Regression 的交叉熵损失函数引入,对sigmoid函数做了一点近似的拉直变形,直接引出了SVM的损失函数 002. 大间隔的最优解 有超参数C开始讨论,当C 足够大时,要minimize目标函数,则需要 第一项等
阅读全文
摘要:1. 验证集Trainning set/交叉验证集Cross validation set/测试集 Test set 2. 模型开发的方向 - 学习曲线 偏差Bias跟Variance方差的平衡 正则化曲线 超参数曲线 数据曲线 3.模型评价及选择 - Precision 跟 Recall 的bal
阅读全文
摘要:Neuron Network 神经网络的权重系数矩阵维度 前向传播表示 神经网络的损失函数表示 整体m个样本 神经网络的梯度下降公式 (拿证回补) 梯度检验 - gradient checking 神经网络的Back propagation - 误差传递 其中可看作是对于aj(l)的“误差”
阅读全文

浙公网安备 33010602011771号