10 2020 档案

班课5
摘要:1. ranked retrieval 是free text queries形式,不需要query语言,直接输入要找的单词就可以 2. 做rank的前提是可以进行排序,如Jaccard Coefficient jaccard(A, B) =|A∩B|/|A∪B|,即两者重复的单词数量比上二者总共的单 阅读全文

posted @ 2020-10-28 19:08 Eleni 阅读(153) 评论(0) 推荐(0)

班课4
摘要:1. non-word spelling errors error指任何不在字典中的word,修正的方式是产生一系列候选名单,选择其中最好的 选择方式有两种,第一个是shortest weighted edit distance,另一个是highest noisy channel probabili 阅读全文

posted @ 2020-10-16 20:27 Eleni 阅读(185) 评论(0) 推荐(0)

班课3
摘要:1. data structure包含term,document frequency以及pointer to postings list 对dictionary的存储首先考虑hashtable,给每一个term一个integer,查找时的复杂度为O(1) 问题是不能进行模糊查询(minor vari 阅读全文

posted @ 2020-10-07 20:38 Eleni 阅读(202) 评论(1) 推荐(0)

导航