随笔分类 -  Rearch

1 2 下一页
论文中页眉页脚的设置方法~【转】
摘要:最近正在准备毕业论文,看着学校统一的、复杂的,所谓“论文规范”直发呆,突然发觉,原来word也是有应用技术的呃… 一番摸索,讲一个比较生疏的一个设置方法,以供分享学习。论文的排版一般都是要求:第一页是封面,第二页是目录,第三页是摘要,第四页以后是正文,最后是论文致谢。正文则要求编上页码,而封面、目录和前言可能不需要页码。以前往往弄论文用的是最原始的办法,将封面、目录、前言放在一个word文档里面,正文部分单独放在另一个word文档里面,然后再插入页码,分开打印。实际上word是可以任意页插入页眉页脚的,只是麻烦一点点,现总结出来,一则作为备忘,二则与大家一起分享。 1、在需要开始打出页码的前. 阅读全文
posted @ 2012-06-04 22:41 COS 阅读(2282) 评论(0) 推荐(0)
Kullback–Leibler divergence-相对熵【转】
摘要:Kullback–Leibler divergenceFrom Wikipedia, the free encyclopedia(Redirected fromRelative entropy)Inprobability theoryandinformation theory, theKullback–Leibler divergence[1][2][3](alsoinformation divergence,information gain,relative entropy, orKLIC) is a non-symmetric measure of the difference betwe 阅读全文
posted @ 2011-12-08 14:48 COS 阅读(1857) 评论(0) 推荐(0)
Dirichlet distribution【转】
摘要:Dirichlet distribution--deeply understandFrom Wikipedia, the free encyclopediaSeveral images of the probability density of the Dirichlet distribution whenK=3 for various parameter vectorsα. Clockwise from top left:α=(6,2,2), (3,7,5), (6,2,6), (2,3,4).Inprobabilityandstatistics, theDirichlet distribu 阅读全文
posted @ 2011-12-08 14:13 COS 阅读(892) 评论(0) 推荐(1)
令人费解的编译错误:error C2144: syntax error : 'double' should be preceded by ';' 和 error C3646: ';' : unknown override specifier
摘要:今天编程莫名其妙的出现了以下两个编译错误:1>e:\日常学习\plsa_nmf\plsa_nmf\sutil.h(10): error C3646: ';' : unknown override specifier1>e:\日常学习\plsa_nmf\plsa_nmf\sutil.h(10): error C2144: syntax error : 'void' should be preceded by ';'或者显示成1>e:\日常学习\plsa_nmf\plsa_nmf\query.cpp(17): error C3646 阅读全文
posted @ 2011-11-30 15:21 COS 阅读(5153) 评论(0) 推荐(1)
判别模型、生成模型与朴素贝叶斯方法【转】
摘要:转载时请注明来源:http://www.cnblogs.com/jerrylead1判别模型与生成模型上篇报告中提到的回归模型是判别模型,也就是根据特征值来求结果的概率。形式化表示为,在参数确定的情况下,求解条件概率。通俗的解释为在给定特征后预测结果出现的概率。比如说要确定一只羊是山羊还是绵羊,用判别模型的方法是先从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。换一种思路,我们可以根据山羊的特征首先学习出一个山羊模型,然后根据绵羊的特征学习出一个绵羊模型。然后从这只羊中提取特征,放到山羊模型中看概率是多少,再放到绵羊模型中看概率是多少,哪个大就是哪个。 阅读全文
posted @ 2011-11-23 10:43 COS 阅读(356) 评论(0) 推荐(0)
最大似然估计(Maximum likelihood estimation) 【转】
摘要:最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差未知。我们没有人力与物力去统计全国每个人的身高,但是可以通过采样,获取部分人的身高,然后通过最大似然估计来获取上述假设中的正态分布的均值与方差。 最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立同分布的。下面我们具体描述一下最大似然估计: 首先,假设为独立同分布的采样,θ为模型参数,f为我们所使用的模型,遵循我们上述的独立同分布假设。参数为θ的模型f产生上述采样可表示为回到上面的“模型已定,参数未知” 阅读全文
posted @ 2011-11-16 15:38 COS 阅读(397) 评论(0) 推荐(1)
判别式模型与生成式模型简单理解
摘要:判别式模型该模型主要对p(y|x)建模,通过x来预测y。在建模的过程中不需要关注联合概率分布。只关心如何优化p(y|x)使得数据可分。通常,判别式模型在分类任务中的表现要好于生成式模型。但判别模型建模过程中通常为有监督的,而且难以被扩展成无监督的。 常见的判别式模型有: Logistic regression Linear discriminant analysis Support vector machines Boosting Conditional random fields Linear regression Neural networks生... 阅读全文
posted @ 2011-11-16 15:32 COS 阅读(329) 评论(1) 推荐(1)
Likelihood principle【转】
摘要:Likelihood principleFrom Wikipedia, the free encyclopediaInstatistics, thelikelihood principleis a controversial principle ofstatistical inferencewhich asserts that all of theinformationin asampleis contained in thelikelihood function.Alikelihood functionarises from aconditional probability distribu 阅读全文
posted @ 2011-11-16 15:24 COS 阅读(489) 评论(0) 推荐(1)
TF-IDF【转】
摘要:TF-IDF维基百科,自由的百科全书TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,互联网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。目录[隐藏]1原理2例子3在向量空间模 阅读全文
posted @ 2011-11-16 15:20 COS 阅读(428) 评论(1) 推荐(1)
Latent Dirichlet allocation【转】
摘要:Latent Dirichlet allocationFrom Wikipedia, the free encyclopediaInstatistics,latent Dirichlet allocation (LDA)is agenerative modelthat allows sets of observations to be explained byunobservedgroups that explain why some parts of the data are similar. For example, if observations are words collected 阅读全文
posted @ 2011-11-14 14:11 COS 阅读(947) 评论(0) 推荐(0)
Plate notation【转】
摘要:Plate notationFrom Wikipedia, the free encyclopediaPlate notationis a method of representing variables that repeat in agraphical model. Instead of drawing each repeated variable individually, a plate or rectangle is used to group variables into a subgraph that repeat together, and a number is drawn 阅读全文
posted @ 2011-11-14 14:07 COS 阅读(868) 评论(0) 推荐(1)
Probabilistic latent semantic analysis【转】
摘要:Probabilistic latent semantic analysis (PLSA), also known asprobabilistic latent semantic indexing(PLSI, especially in information retrieval circles) is astatistical techniquefor the analysis of two-mode and co-occurrence data. PLSA evolved fromlatent semantic analysis, adding a sounder probabilisti 阅读全文
posted @ 2011-11-14 13:41 COS 阅读(559) 评论(0) 推荐(1)
Matlab编程学习笔记【待续】
摘要:最近想用Matlab进行数据分析,算法性能测试,平时由于用的是C、C++,因此很多习惯都一时改不了,这里自己列出来一些Matlab中明显不同的地方。矩阵单元元素访问方式:A(1,2)---A[1][2]选取矩阵某个行或者列:A(:,1);%选取矩阵第一列.A(1,:);%选取矩阵第一行矩阵单元以及数组等起始下标:行和列都是从1开始,A(1,1)为第一个元素 A(0,1)则是越界 相应的A(1,columns)不越界Matlab矩阵的存放是列优先,而我们平时的都是行优先。例如:A是一个2行2列的矩阵。A(2)代表的是A(2,1)而不是A(1,2)运算符号:~表示! ,| & 相应的表示| 阅读全文
posted @ 2011-11-10 21:15 COS 阅读(920) 评论(2) 推荐(1)
诡异难解决的错误:Windows已在xxx.exe中触发一个断点
摘要:windows已在xxx.exe中触发一个断点,其原因可能是堆被损坏,这说明xx.exe中或它所加载的任何DLL中有bug。 原因也可能是用户在xx.exe具有焦点时按下了F12。输出窗口可能提供了更多诊断信息 。 当碰到此种错误的时候,基本上是因为我们在编写程序的时候,在处理数组或者指针的时候出现了越界(最可能)或者超长的情况,从而导致了对栈堆的损坏。 我自己的程序就是因为一个很隐藏的变量没有置零造成的,在每次重用cor空间时,correlation记得置为0了,而cor_index却没有set 为 0.因而随着多次重用,cor_index的值越来越大,从而在访问cor[cor_... 阅读全文
posted @ 2011-11-09 23:34 COS 阅读(13725) 评论(0) 推荐(3)
matlab文件操作及读txt文件【转】
摘要:文件操作是一种重要的输入输出方式,即从数据文件读取数据或将结果写入数据文件。MATLAB提供了一系列低层输入输出函数,专门用于文件操作。1、文件的打开与关闭1)打开文件在读写文件之前,必须先用fopen函数打开或创建文件,并指定对该文件进行的操作方式。fopen函数的调用格式为:fid=fopen(文件名,‘打开方式’)说明:其中fid用于存储文件句柄值,如果返回的句柄值大于0,则说明文件打开成功。文件名用字符串形式,表示待打开的数据文件。常见的打开方式如下: ‘r’:只读方式打开文件(默认的方式),该文件必须已存在。 ‘r+’:读写方式打开文件,打开后先读后写。该文件必须已存在。 ‘w 阅读全文
posted @ 2011-11-07 20:27 COS 阅读(846) 评论(0) 推荐(1)
Latent semantic indexing【转】
摘要:Latent Semantic Indexing (LSI) is an indexing and retrieval method that uses a mathematical technique called Singular value decomposition (SVD) to identify patterns in the relationships between the terms and concepts contained in an unstructured collection of text. LSI is based on the principle that 阅读全文
posted @ 2011-11-01 16:37 COS 阅读(579) 评论(0) 推荐(1)
LDA,咱们一起来学习【转】
摘要:首先,我以前总结过,关于北邮一个人写的导读,连接在这里。肯定得看Blei 2003年的论文,点击下载。然后很重要的Blei的视频和一个80多页的Lecture。Topic ModelsLatent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。关键所在:it posits that each document is a mixture of a small number of topics and that each word’s creation is attributable to one of the docum 阅读全文
posted @ 2011-10-31 16:11 COS 阅读(532) 评论(0) 推荐(1)
判别模型和生成模型(Discriminative Model& Generative Model)【转】
摘要:又是碰到了一些简单的基本概念,但是仔细想想发现自己没有理解透彻,Search一下,总结如下:【摘要】- 生成模型:无穷样本==》概率密度模型 = 产生模型==》预测- 判别模型:有限样本==》判别函数 = 预测模型==》预测【简介】简单的说,假设o是观察值,q是模型。如果对P(o|q)建模,就是Generative模型。其基本思想是首先建立样本的概率密度模型,再利用模型进行推理预测。要求已知样本无穷或尽可能的大限制。这种方法一般建立在统计力学和bayes理论的基础之上。如果对条件概率(后验概率) P(q|o)建模,就是Discrminative模型。基本思想是有限样本条件下建立判别函数,不考虑 阅读全文
posted @ 2011-10-31 16:09 COS 阅读(1626) 评论(0) 推荐(0)
因子分析法(Factor Analysis Method) 【转】
摘要:目录1 什么是因子分析2 因子分析法的步骤3 因子分析法的实例 [1]4 因子分析与主成分分析的区别 [2]5 相关条目6 参考文献什么是因子分析 因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。基本思想是:根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。因子分析法的步骤 应用因子分析法的主要步骤如下: (1)对数据样本进行标准化处理。 (2)计算样本的相关矩阵R。 (3)求相关矩阵R的特征根和特征向量。 ... 阅读全文
posted @ 2011-10-27 13:39 COS 阅读(2865) 评论(0) 推荐(1)
主成分分析(principal components analysis)介绍【转】
摘要:主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法目录1 什么是主成分分析法2 主成分分析的基本思想3 主成分分析法的基本原理4 主成分分析的主要作用5 主成分分析法的计算步骤6 主成分分析法的应用分析6.1 案例一:主成分分析法在啤酒风味评价分析中的应用[1]6.1.1 1 材料与方法6.1.2 2 主成分分析法的基本原理6.1.3 3 主成分分析法在啤酒质量一致性评价中的应用6.1.4 4 结论7 相关条目8 参考文献什么是主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在统计学中,主 阅读全文
posted @ 2011-10-27 13:34 COS 阅读(3121) 评论(0) 推荐(1)

1 2 下一页