基于大规模语料的新词发现算法【转自matix67】
摘要:最近需要对商品中的特有的词识别,因此需新词发现算法,matrix的这篇算法很好。 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未
阅读全文
posted @ 2016-07-18 17:08
posted @ 2016-07-18 17:08
posted @ 2015-07-17 20:01
posted @ 2015-07-12 23:24
posted @ 2015-07-06 19:24
posted @ 2015-05-15 23:25