公告

随笔分类 - 算法

摘要：概述：隐式语义模型将query与document映射到低维空间，把二者的相关性问题转化为低维空间向量的距离。DSSM使用深度结构实现此映射过程，同时提出word hashing技术使得模型适用于大规模数据经典的隐式语义模型：概述：隐式语义模型将query与document映射到低维空间，把二者的阅读全文

posted @ 2018-07-24 14:53 bytedance 阅读(2952) 评论(0) 推荐(0)

FastText

摘要：总览用途：文本分类优点：在精度上与深度学习的方法媲美，但更高效，速度快多个数量级。模型结构 fastText的结构：输入为一个句子的N个词(ngram)的向量和表示，训练之前单个词向量可利用随机数进行初始化，随后将这些词向量加权平均得到对应文本的向量表示；输出为文本对应的标签。此模型结构与CB 阅读全文

posted @ 2018-07-12 17:45 bytedance 阅读(538) 评论(0) 推荐(0)

树模型及其提升方法

摘要：树模型应用场景：1.分类 2.回归步骤：特征选择+树的生成+剪枝分类应用中的树模型等价于if-then规则的集合or定义在特征空间与类空间的条件概率分布，可解释性强概念： 1. 熵：表示随机变量的不确定程度，其数值越大，则随机变量的不确定性也越大 2.条件熵：表示在已知随机变量X的条件下随机阅读全文

posted @ 2018-06-15 10:30 bytedance 阅读(874) 评论(0) 推荐(0)