野路子程序员

2020年12月31日

摘要： 1.UDAF定义 spark中的UDF(UserDefinedFunction)大家都不会陌生, UDF其实就是将一个普通的函数, 包装为可以按行操作DataFrame中指定Columns的函数. 例如, 对某一列的所有元素进行+1操作, 它对应mapreduce操作中的map操作. 这种操作有阅读全文

posted @ 2020-12-31 17:28 野路子程序员阅读(446) 评论(0) 推荐(0)

2017年9月20日

信息论基本概念 - 各种熵的解释

摘要：文章导读： 1. 熵 2. 联合熵和条件熵 3. 互信息 4. 相对熵 5. 交叉熵 6. 困惑度 7. 模拟信道模型最近在看《统计自然语言处理》，觉得第二章预备知识里的关于信息论的一些基本概念总结得很不错。虽然对于熵这个词，我接触过很多次，在机器学习里的很多地方也都有涉及到，比如说最大熵模型，决阅读全文

posted @ 2017-09-20 12:14 野路子程序员阅读(2596) 评论(0) 推荐(1)

2017年9月18日

【神经网络和深度学习】笔记 - 第六章深度学习

摘要：文章导读： 1. 卷积神经网络 2. 卷积神经网络实践深度神经网络在可以模拟更加复杂的情形，但是在上一章中，我们发现训练深度神经网络的时候会出现梯度消失的问题，从而导致模型训练失败。这一章，将会介绍可以被用在深度学习上的一些技术。这章的主要内容是介绍一种应用最广泛的深度神经网络：卷积神经网络。我阅读全文

posted @ 2017-09-18 16:00 野路子程序员阅读(3253) 评论(0) 推荐(3)

2017年9月14日

【神经网络和深度学习】笔记 - 第五章深度神经网络学习过程中的梯度消失问题

摘要：文章导读： 1. 梯度消失问题 2. 是什么导致了梯度消失问题？ 3. 复杂神经网络中的梯度不稳定问题之前的章节，我们利用一个仅包含一层隐藏层的简单神经网络就在MNIST识别问题上获得了98%左右的准确率。我们于是本能会想到用更多的隐藏层，构建更复杂的神经网络将会为我们带来更好的结果。就如同在进阅读全文

posted @ 2017-09-14 12:22 野路子程序员阅读(4738) 评论(1) 推荐(1)

2017年9月11日

【神经网络和深度学习】笔记 - 第四章神经网络可以实现任意函数的直观解释

摘要：文章导读： 1. 两个前提 2. 单输入单输出的情况 3. 一般情形：多输入多输出情况 4. 使用sigmoid以外的神经元 5. 修正阶跃函数 6.总结神经网络最令人激动的一个性质，就是它可以实现任意功能的函数。而且是即使对于只有一个隐藏层的神经网络，这个结论依然成立。大部分神经网络的使用者都阅读全文

posted @ 2017-09-11 20:22 野路子程序员阅读(16707) 评论(2) 推荐(4)

2017年9月7日

【神经网络和深度学习】笔记 - 第三章如何提高神经网络学习算法的效果

摘要：文章导读： 1.交叉熵损失函数 1.1 交叉熵损失函数介绍 1.2 在MNIST数字分类上使用交叉熵损失函数 1.3 交叉熵的意义以及来历 1.4 Softmax 2. 过拟合和正则化 2.1 过拟合 2.2 正则化 2.3 为什么正则化可以减轻过拟合问题 2.4 正则化的其它方法 3. 参数初始化阅读全文

posted @ 2017-09-07 17:25 野路子程序员阅读(2525) 评论(4) 推荐(2)

2017年8月25日

【神经网络和深度学习】笔记 - 第二章反向传播算法

摘要：文章导读： 1. 一种基于矩阵运算快速计算神经网络输出的方法 2. 关于损失函数的两个假设 3. Hadamard积 - $s\odot t$ 4. 反向传播算法背后的四个基本方程 5. 四个方程的证明(选学) 6. 反向传播算法 7. 反向传播算法的代码实现 8. 反向传播为什么被认为是快速的算法阅读全文

posted @ 2017-08-25 15:18 野路子程序员阅读(9946) 评论(4) 推荐(1)

2017年8月22日

【神经网络和深度学习】笔记 - 第一章使用神经网络识别手写数字

摘要：文章导读： 1. 本书内容 2. 手写字体识别 3. 感知机 4. Sigmoid神经元 5. 神经网络的结构 6. 一个用于手写数字识别的简单神经网络 7. 梯度下降学习算法 8. 数字识别神经网络的实现 9. 关于深度学习深度学习算是现在机器学习领域非常热门的方向了，虽然一直有了解并且简单用过阅读全文

posted @ 2017-08-22 19:33 野路子程序员阅读(4533) 评论(8) 推荐(8)

2017年7月26日

Spark ML下实现的多分类adaboost+naivebayes算法在文本分类上的应用

摘要：文章导读： 1. Naive Bayes算法 2. Adaboost算法 3. Spark ML的使用 4. 自定义扩展Spark ML 1. Naive Bayes算法朴素贝叶斯算法算是生成模型中一个最经典的分类算法之一了，常用的有Bernoulli和Multinomial两种。在文本分类上经常阅读全文

posted @ 2017-07-26 21:40 野路子程序员阅读(5252) 评论(3) 推荐(0)

野路子程序员

公告

野路子程序员