随笔分类 - Nature Language(自然语言)
自然语言处理
摘要:RBF 网络起源于数值分析中的多变量插值的径向基函数方法,其所具有的最佳逼近特性是传统BP 网络所不具备的。三层的RBF 网络具有可以逼近任意函数的能力。假设网络中的输入节点隐层节点输出节点数分别为N,L,M 。隐含层的作用是对输入模式进行变换将低维的模式输入数据转换到高维空间内以利于输出层进行分类识别。最常用的径向基函数是高斯核函数 ,形式为 k(||x-xc||)=exp{- ||x-xc||...
阅读全文
摘要:在上一篇文章 《人工神经网络(Artificial Neural Netwroks)笔记-消除样本顺序的BP算法 》中 修改权重的方法被称为"最速下降法"。每一次权重的修改都是确定的,权重都会被修改。甚至到最简单的单层感知器也是如此。但是我们有一个疑问,是否每一次的权重修改都是好的呢?虽然"最速下降法"能在数学上被证明是每一次都比前一次越来越逼近最优解,但是这个逼近可是一个无休止的过程。而且面对局...
阅读全文
摘要:花了一个多星期的时间在重新学习 人工神经网络(Artificial Neural Netwroks)关于人工神经网络(Artificial Neural Netwroks)的介绍以及应用可以通过网络获得在我的笔记中主要关于多个算法流程是如何实现的“读书每有所得必记录之” 某人说的,因此我也诞生了下面的笔记和大家分享人工神经网络(Artificial Neural Netwroks)笔记-离散单输出...
阅读全文
摘要:人工神经网络(Artificial Neural Netwroks)笔记-基本BP算法 上文中已经提到“基础BP算法“偏爱”较后出现的样本,因此较后出现的样本对网络影响较大”本文将记录如何消除这个影响用(X1,Y1),(X2,Y2),....(Xs,Ys)的总效果丢该 W^(1),W^(2),...W^(L)△W^(K)ij=∑△pW^(k)ij只是替换了原来的简单修改权重矩阵那部分具体算法流程如...
阅读全文
该文被密码保护。
摘要:人工神经网络(Artificial Neural Netwroks)笔记--离散多输出感知器训练算法 中的2.1.3步是多个判断,因此我们说它是一种离散多输出感知器现在采用公式 Wij=Wij+α(Yj-Oj)Xi取代了那个步骤Yj和Oj之间的差别对Wij的影响由α(Yj-Oj)Xi表现出来这样做的好处是不仅使得算法的控制在结构上更容易理解,而且还使得它的适应面更宽算法流程如下:1.用适当的小伪随...
阅读全文
摘要:这是对离散单输出感知器算法的扩展相关的符号定义请参考 《人工神经网络(Artificial Neural Netwroks)笔记-离散单输出感知器算法 》OK,Start Our Game1.初始化权重矩阵W;2.重复下列过程,直到训练完成:2.1对每个样本(X,Y),重复如下过程:2.1.1 输入X;2.1.2计算O=F(XW);2.1.3 for j=1 to m do 执行如下操作:ifOj...
阅读全文
该文被密码保护。
摘要:最近在重新学习人工神经网络(Artificial Neural Netwroks),做做笔记,整理思路离散单输出感知器算法,传说中的MP二值网络:自变量及其函数的值、向量分量的值只取0和1函数、向量权向量:W=(w1,w2,w3.....wn)输入向量:X=(x1,x2,x3.....xn)训练样本集{(X,Y)|Y为输入向量X的输出}训练过程比较简单如下:1,初始化权向量W2,重复下列过程,直到...
阅读全文
摘要:互信息(Mutual Information,MI)
阅读全文
摘要:刚才一朋友有一个需求,就是抽取web页面列表的内容例如论坛的帖子列表,他要求通用化的简单地想了一下,思路如下:利用HtmlAgilityPack (C#) 把页面的html变成DOM树以方便操作遍历节点,计算节点之间的相似度如果节点的相似度比较高的就可以认为是相似的节点而且通过DOM树可以知道节点是否同级如果同级或者层次相同的话那么基本上就是列表里面的节点了简单思路,欢迎讨论
阅读全文
摘要:在7.9余弦定理+空间向量--我的数学3中简单地说了一下利用余弦定理来计算文本相似度。下面是利用余弦定理和广义Jaccard系数来计算文本相似度。简单介绍一下Jaccard系数:广义Jaccard系数可以用于文档数据,并在二元属性情况下归约为Jaccard系数。广义Jaccard系数又称Tanimoto系数。(有另一种系数也称为Tanimoto系数)。该系数用EJ表示,由下式定义:EJ(x,y)=...
阅读全文
摘要:倒排序索引实验,无意义,无价值,纯粹为了理清思路ReverseOrderIndex.rar测试代码下载class Word 为主要被索引的词,其中 public IList<string> FileList; 该词所在的文件列表 public IList<TF> Degree;该词在对应的文件中出现的次数以及位置索引 public IList<int> Pos...
阅读全文

浙公网安备 33010602011771号