摘要: Corpus语料库与DB数据库 World Knowledge世界常识库:OALD牛津高阶/Synonyms/Phrases/…, 新华字典/成语词典/辞海, 行业词典,大英百科,Wikipedia,… 全局信息: Corpus语料库、行业通用数据库(例如Springer/Google Schola 阅读全文
posted @ 2023-06-11 09:04 abaelhe 阅读(108) 评论(0) 推荐(0)
摘要: 自动断句:用户实时输入的每个字符/词,计算是断句词的统计概率: 取输入序列向前的 N-Gram长度,统计概率判断。 例如 :[“。”(句号)],[“?”(问号)],[正式,结束],[好了,吗],…, 而这些是可以通过历史交互数据与Corpus/DB, 进行统计学习训练得到的(每个词是断句词的统计概率 阅读全文
posted @ 2023-06-11 02:19 abaelhe 阅读(74) 评论(0) 推荐(0)