摘要:
有1,2,3....n个数组,每个数组包含一系列一维线段的表示,每个数组的元素结构为(point,length)(point>=0 且 length>=1,都为整数),表示从point开始长为length的线段,现将n个数组中的线段合并,其中需要考虑数组的优先级:1>2>....>n,高优先级的数组 阅读全文
posted @ 2018-04-03 11:55
Shendu.CC
阅读(550)
评论(2)
推荐(0)
摘要:
上一篇中,主要说的就是词袋模型。回顾一下,在进行文本分类之前,我们需要把待分类文本先用词袋模型进行文本表示。首先是将训练集中的所有单词经过去停用词之后组合成一个词袋,或者叫做字典,实际上一个维度很大的向量。这样每个文本在分词之后,就可以根据我们之前得到的词袋,构造成一个向量,词袋中有多少个词,那这个 阅读全文
posted @ 2018-04-03 11:50
Shendu.CC
阅读(13514)
评论(0)
推荐(0)
浙公网安备 33010602011771号