摘要: 〔来龙去脉〕 struct UserDict { UserDict () : m_db(NULL) {} ~UserDict (); bool load(const char* fname); unsigned addWord(CSyllables &syllables, const wstring 阅读全文
posted @ 2025-10-30 19:21 华容道专家 阅读(12) 评论(0) 推荐(0)
摘要: [来龙去脉] 语料:wiki_zh 1.2GB 词典:74001行 sysdic,其中字约17,000个,来自googlepinyin. 不是所有的GB18030汉字都能用UNICODE表示。GB18030采用单/双/四字节混合编码。 词是googlepinyin+sunpinyin合并去重。喜羊羊 阅读全文
posted @ 2025-10-30 16:49 华容道专家 阅读(5) 评论(0) 推荐(0)