摘要:概述:隐式语义模型将query与document映射到低维空间,把二者的相关性问题转化为低维空间向量的距离。DSSM使用深度结构实现此映射过程,同时提出word hashing技术使得模型适用于大规模数据 经典的隐式语义模型: 概述:隐式语义模型将query与document映射到低维空间,把二者的
阅读全文
随笔分类 - 算法
摘要:概述:隐式语义模型将query与document映射到低维空间,把二者的相关性问题转化为低维空间向量的距离。DSSM使用深度结构实现此映射过程,同时提出word hashing技术使得模型适用于大规模数据 经典的隐式语义模型: 概述:隐式语义模型将query与document映射到低维空间,把二者的
阅读全文
摘要:总览 用途:文本分类 优点:在精度上与深度学习的方法媲美,但更高效,速度快多个数量级。 模型结构 fastText的结构:输入为一个句子的N个词(ngram)的向量和表示,训练之前单个词向量可利用随机数进行初始化,随后将这些词向量加权平均得到对应文本的向量表示;输出为文本对应的标签。此模型结构与CB
阅读全文
摘要:树模型 应用场景:1.分类 2.回归 步骤:特征选择+树的生成+剪枝 分类应用中的树模型等价于if-then规则的集合or定义在特征空间与类空间的条件概率分布,可解释性强 概念: 1. 熵:表示随机变量的不确定程度,其数值越大,则随机变量的不确定性也越大 2.条件熵:表示在已知随机变量X的条件下随机
阅读全文
|