摘要: 双数组Trie树(Double array Trie, DAT)是由三个日本人提出的一种Trie树的高效实现 [1],兼顾了查询效率与空间存储。Ansj便是用DAT(虽然作者宣称是三数组Trie树,但本质上还是DAT)构造词典用作初次分词,极大地节省了内存占用。本文将简要地介绍DAT,并实现了基于D阅读全文
posted @ 2017-01-09 14:49 Treant 阅读(823) 评论(0) 编辑