摘要:
搜索 query rewrite 指导召回 意图识别 分词、结合(短分词结合)、粘连(要求连续命中) 核心词/Fuzzy 同义词:严格同义词 (上下文同义词在qsrch中触发) 检索field(title检索、类别搜索、全文检索) 成分识别/NER 指导rank 实体识别 词权重 动态词权重:ter 阅读全文
posted @ 2021-10-30 19:12
唐旺
阅读(108)
评论(0)
推荐(0)
摘要:
强化学习 表格型求解 按direclet分布随机 direclet分布式高维情况的beta分布。 下面介绍beta分布。 beta分布:以击棒球为例,根据某人的击球数据,估计其命中率$\theta$,取值范围[0,1],此时可以将这个人的命中率的概率分布视为beta分布,该分布的特性是,当击球次数较 阅读全文
posted @ 2021-10-30 19:10
唐旺
阅读(203)
评论(0)
推荐(0)
摘要:
名词解释 符号 说明 q 用户提交的查询请求 d 需要排序的文档 D 一次请求召回的待排序文档集 \(x_i\) 结果i的特征 s 模型计算得到的文档得分。\(s_i = score(x_i)\), $score(x)$就是我们要求解的模型。 (i,j) 文档$d_i$和$d_j$组成的有序pair 阅读全文
posted @ 2021-10-30 19:08
唐旺
阅读(115)
评论(0)
推荐(0)
摘要:
CRF的learning问题 如通常的分类问题,x属于分类y的概率模型为: \[ p(y|x) = \frac{\exp{(score(y,x))}}{\sum_{\forall \ y^{'}}\exp{(score(y^{'}, x))}} \] 名词解释 术语 含义 \(x\) 样本特征,可以 阅读全文
posted @ 2021-10-30 19:06
唐旺
阅读(152)
评论(0)
推荐(0)

浙公网安备 33010602011771号