07 2015 档案

摘要:t:代表特征,|C|:代表类别总数,ci 代表第i个类别 CF[i][j]:代表term class frequency,即表示在第j个类别的文档中出现了第i个term的文档数 DF[i]:代表term document frequency,即表示样本集中出现了该term的文档数 docsPerCl... 阅读全文
posted @ 2015-07-16 15:11 asonee 阅读(1807) 评论(0) 推荐(0)
摘要:在java语言中,提供了三个特殊的浮点数值:正无穷大、负无穷大和非数(NaN),功能是表示溢出和出错。 无穷大:一个正数除以0.0或一个负数除以0.0将得到一个正无穷大或负无穷数 非数:0.0除以0.0或则负数开方将得到一个非数 阅读全文
posted @ 2015-07-10 11:47 asonee 阅读(3805) 评论(0) 推荐(0)
摘要:由于Map中的TreeMap只能按key排序,本文中实现了通过Collections工具类及comparator接口实现Map按value排序 package me; import java.util.ArrayList; import java.util.Collections; import j... 阅读全文
posted @ 2015-07-10 10:55 asonee 阅读(1235) 评论(0) 推荐(0)
摘要:一、特征规约/降维:去掉可分性不强和冗余的特征特征选择:去掉可分性不强的特征 特征抽取/变换:去掉多余的特征,即抽取出来的特征不存在线性or非线性关系 ==========================================================================... 阅读全文
posted @ 2015-07-10 09:52 asonee 阅读(267) 评论(0) 推荐(0)