摘要: 在知乎网站上看到一个关于词向量的问题:词向量( Distributed Representation)工作原理是什么,哪位大咖能否举个通俗的例子说明一下? 恰好最近在学习 word2vec, 尝试着根据对所读文献的理解写了个回答,供大家参考。 要将自然语言交给机器学习算法来处理,通常需要首先将... 阅读全文
posted @ 2013-10-16 17:14 peghoty 阅读(2033) 评论(0) 推荐(0) 编辑
摘要: 本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文... 阅读全文
posted @ 2013-09-26 10:48 peghoty 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文... 阅读全文
posted @ 2013-09-26 10:48 peghoty 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关... 阅读全文
posted @ 2013-09-26 10:47 peghoty 阅读(462) 评论(0) 推荐(0) 编辑
摘要: 本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上... 阅读全文
posted @ 2013-09-26 10:47 peghoty 阅读(644) 评论(0) 推荐(1) 编辑
摘要: 本文来自知乎 @杜鑫 的回答 比如百度 1T,腾讯、360 多 T,就硬件成本来计算,是不是太可怕了,公司会投入这么多么?假设百度盘一千万用户,每人 1T,有人能算算成本么?真相究竟是什么?我想要为每个用户提供 1G 的网络存储空间。 如果服务器上有一颗 1000G 的硬盘可以全部为用户提供... 阅读全文
posted @ 2013-09-16 09:26 peghoty 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 本文整理自@老师木的一条图片新浪微博,从另一个角度给出为何采用 sigmoid 函数作非线性变换的解释。为什么我们喜欢用 sigmoid 这类 S 型非线性变换? 阅读全文
posted @ 2013-09-09 23:10 peghoty 阅读(570) 评论(0) 推荐(0) 编辑
摘要: UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月... 阅读全文
posted @ 2013-09-09 08:08 peghoty 阅读(353) 评论(0) 推荐(0) 编辑
摘要: 在《主成分分析》中,我们用到了协方差矩阵,但当时并没有对其进行深入的讨论。为此,本文将针对协方差矩阵做一个详细的介绍,其中包括协方差矩阵的定义、数学背景与意义以及计算公式的推导。若需要本文完整的 PDF 文档,请点击《协方差矩阵详谈》进行下载!作者: peghoty出处:http://blog... 阅读全文
posted @ 2013-09-09 07:45 peghoty 阅读(519) 评论(0) 推荐(0) 编辑
摘要: UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月... 阅读全文
posted @ 2013-09-09 07:14 peghoty 阅读(299) 评论(0) 推荐(0) 编辑
摘要: UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月... 阅读全文
posted @ 2013-09-03 23:33 peghoty 阅读(467) 评论(0) 推荐(0) 编辑
摘要: UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月... 阅读全文
posted @ 2013-09-03 23:20 peghoty 阅读(651) 评论(0) 推荐(0) 编辑
摘要: 召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中召回率是是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。 从一... 阅读全文
posted @ 2013-09-01 23:47 peghoty 阅读(623) 评论(0) 推荐(0) 编辑
摘要: 本文从数学上对逻辑回归做了一个详尽的分析,其中包括回归分析、最小二乘法、sigmoid 函数以及梯度下降等知识点的介绍。目录1 回归分析 1.1 基本概念 1.2 最小二乘法2 逻辑回归 2.1 逻辑函数 2.2 梯度下降法 2.3 训练算法文中提到的相关性分析可参见《相关性分析》。若需要本文完整的... 阅读全文
posted @ 2013-09-01 22:03 peghoty 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 文中尺度化的一些具体公式可参见http://blog.csdn.net/itplus/article/details/10088101其他相关链接引言预备知识直接聚类法K-meansDBSCANOPTICS聚类分析的效果评测作者: peghoty出处:http://blog.csdn.net/itp... 阅读全文
posted @ 2013-08-29 08:22 peghoty 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 本文摘自中国科学院计算技术研究所周昭涛的硕士论文《文本聚类分析效果评价及文本表示研究》的第三章,算是一则读书笔记吧,希望对大家有点帮助。文中提到的准确率和召回率的定义可参见http://blog.csdn.net/itplus/article/details/10862059其他相关链接:引言... 阅读全文
posted @ 2013-08-26 00:27 peghoty 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10089323欢迎转载/分享,... 阅读全文
posted @ 2013-08-20 01:00 peghoty 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088429欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:59 peghoty 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088283欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:57 peghoty 阅读(348) 评论(0) 推荐(0) 编辑
摘要: 第一章 引言第二章 预备知识第三章 直接聚类法第四章 K-means第五章 DBSCAN第六章 OPTICS第七章聚类分析的效果评测第八章数据尺度化问题 作者: peghoty出处:http://blog.csdn.net/itplus/article/details/10088101欢迎转载/分享... 阅读全文
posted @ 2013-08-20 00:57 peghoty 阅读(184) 评论(0) 推荐(0) 编辑