上一页 1 ··· 143 144 145 146 147 148 149 150 151 ··· 236 下一页
该文被密码保护。 阅读全文
posted @ 2017-03-21 15:10 blcblc 阅读(1) 评论(0) 推荐(0)
摘要: 在做文本挖掘,特别是有监督的学习时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍两种常用的特征选择方法: 互信息 一个常用的方法是计算文档中的词项t与文档类别c的互信息MI,MI度量的是词的存在与否给 阅读全文
posted @ 2017-03-21 13:59 blcblc 阅读(678) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 11:16 blcblc 阅读(2) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:07 blcblc 阅读(1) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:04 blcblc 阅读(4) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-21 00:00 blcblc 阅读(1) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-20 23:07 blcblc 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-20 22:27 blcblc 阅读(0) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2017-03-20 21:44 blcblc 阅读(0) 评论(0) 推荐(0)
摘要: 参考 http://blog.csdn.net/sdj222555/article/details/7875575 RMQ 就是 Range Minimum/Maximum Query 就是求区间最值问题。 可以写一个线段树,但是预处理和查询的复杂度都是O(logn)。这里有更牛的算法,就是ST算法 阅读全文
posted @ 2017-03-20 20:39 blcblc 阅读(147) 评论(0) 推荐(0)
上一页 1 ··· 143 144 145 146 147 148 149 150 151 ··· 236 下一页