随笔分类 - AI
摘要:我们通过几个例子直观体会如何运作。 通过对神经网络的代价函数进行正则化,我们为什么可以解决过拟合??? 一个比较直观的解释就是,当我们把λ 设置的非常大,权重矩阵w就会被设置为非常接近0的值,这个直观的理解就是把很多隐藏神经元的权重几乎设置成0了,这就导致这些隐藏神经元的影响被消除了,神经网络被大大
阅读全文
摘要:之前看到的识别名字的NLP案例,是输入和输出长度相同的一个RNN模型 实际上,还有很多其他种类的RNN模型 输入的x和输出的y可以是不同类型的数据,而且Tx和Ty不一定相等。 一对多 递归神经网络 例子:音乐生成器 输入的x可能只是一串数字,一个音符,一些文本或关键词 为了告诉你你想要的旋律,生成的
阅读全文
摘要:如果我怀疑我的模型存在过拟合或者说高方差的问题 那么正则化可能是需要首先尝试的手段 获取更多数据可能也是不错的手段,很好理解,导致高方差的数据往往相较于大多数聚集的数据,比较分散,如果数据集足够庞大,这种个例兮兮的数据就会权重降低,但是获取数据并不简单,或者说会花费更多成本。 正则化有助于过拟合,也
阅读全文
摘要:通常在编程框架中实现反向处理是很简单的,因为编程框架是可以自动处理反向。 但是我们有必要了解RNNs中backprop是怎么运作的。 我们为了实现反向传播,也就是把整个计算流程反向。 最关键的反向计算是a<0>--a<1>--a<2>--....--a<Tx>这一链的反向计算,这里使用了一种非常快速
阅读全文
摘要:如何构建一个神经网络来实现从x到y的映射??? 实现过程中的困难: 1,输入和输出对于不同的例子会有不同的长度 或许可以给每个例子一个最大长度,将不足长度的部分用0补足,但是不是最好 2,这样一个朴素的神经网络,不能共享从不同文本位置学到的特征,尤其是神经网络学到了训练集中经常出现的词汇,我们希望在
阅读全文
摘要:训练神经网络的基本原则 当训练好了一个最初的神经网络 首先问 这个算法是否有高偏差??? 也就是是不是欠拟合 如果是高偏差: 解决高偏差,要么换更大的网络,要么延长训练的时间,(找更好的网络) 等到做完了这些,再判断这个算法是否有高偏差,直到在训练集上能够拟合好数据, 然后问 这个算法是否有高方差?
阅读全文
摘要:建模会用到的符号 举个例子: 下面的句子作为序列模型的输入数据 x: Harry Potter and Hermione Granger invented a new spell 假设你想让模型识别出句子中哪些单词是人名,那么这就是一个名字识别的例子,常被用在搜索引擎中(比如对过去24小时新闻中提到
阅读全文
摘要:偏差-方差困境(the bias-variance trade-off) 举个例子 左边这个如果用单层神经网络,逻辑回归的话,就是这样一条直线,没有很好的将数据集分类,我们把这种情况称为欠拟合(underfitting)高偏差 中间这个不那么复杂但是能正确分类的算法,对数据进行了合理的处理,正正好好
阅读全文
摘要:AI是21世纪的媲美电的发明 神经网络(Neural Networks) 深度学习(Deep Learning) 第一节课我将学习如何建立一个神经网络,以及一个深度神经网络,如何在数据上训练它。 我们会以猫的图片为训练对象,我们要做的事是识别:这是猫,这不是猫 第二节课我将进行深度学习方面的实践。学
阅读全文
摘要:逻辑斯蒂回归是一种二进制分类算法 比如说我们举个例子 这样一个案例中,你需要输入图像,输出标签,识别判断这个图像是/不是一只猫(用0/1表示) 在计算机中,怎么让计算机接受图片,或者说计算机只认识二进制语言,怎么让它看见这些图像数据??? 如果说你传入的图像是一张64像素位*64像素位的图片 那么计
阅读全文
摘要:mooc讨论区联系 email联系 如果是企业培训deeplearning或者大学课程培训,请email联系。
阅读全文
摘要:第一节课的细节部分 每节课后会有10个选择题看看你掌握得怎么样 第1周,介绍深度学习,神经网络。 第2周,神经网络的编程基础,动手实现一个能用的神经网络 第3周,编写一个单独的隐藏层神经网络,了解实现神经网络所需的所有关键概念 第4周,编写一个深度神经网络,这是一个多层的神经网络。
阅读全文
摘要:我们可以看到机器学习的监督学习在对结构化和非结构化数据的处理上非常好,那么为什么深度学习在最近兴起了? 如果你使用的是传统的算法,比如支持向量机和逻辑回归这种函数来处理数据。 最近几十年,人们在互联网上制造了非常多的数据,搜集了非常多的数据。 现在那些传统的机器学习算法得不到很好的处理效果 而这是神
阅读全文
摘要:介绍一下监督学习 input(x) output(y) application 情况 home features price real estate 输入房子的特征,输出房价。 Ad,user information click on ad?(0/1) online advertising 线上投放
阅读全文
摘要:深度学习指的是训练神经网络,有时候规模很大 那么神经网络到底是什么??? 比方说我们现在有这么一张图 这张图叫: Housing Price Prediction 我们有的数据是六个房子的面积和每平米的单价。 我们现在知道了logestic回归模型,我们将数据输入这个模型,会拟合出一条穿过这些数据的
阅读全文
摘要:神经网络(Neural Networks) 深度学习(Deep Learning) 第一节课我将学习如何建立一个神经网络,以及一个深度神经网络,如何在数据上训练它。 我们会以猫的图片为训练对象,我们要做的事是识别:这是猫,这不是猫 第二节课我将进行深度学习方面的实践。学习严密的构建神经网络,如何真正
阅读全文