随笔分类 - 数据挖掘
摘要:这篇文章有讲: http://www.36dsj.com/archives/24006 第一点,在学习Deep learning和CNN之前,总以为它们是很了不得的知识,总以为它们能解决很多问题,学习了之后,才知道它们不过与其他机器学习算法如svm等相似,仍然可以把它当做一个分类器,仍然可以像使用一
阅读全文
摘要:Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广。 参考:http://blog.csdn.net/u014422406/article/details/52805924 sigmoid将一个real value映射到(0,1)的区间(当然也可以是(-1,1)),这样可以
阅读全文
该文被密码保护。
摘要:在做文本挖掘,特别是有监督的学习时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍两种常用的特征选择方法: 互信息 一个常用的方法是计算文档中的词项t与文档类别c的互信息MI,MI度量的是词的存在与否给
阅读全文

浙公网安备 33010602011771号