bytedance

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年2月2日

摘要: 整体框架 训练流程 1.初始化网络:class NetWork; 2.实例化实际的boosting树:依据参数选择不同模型,如GBDT、DART、GOSS、RF; 3.实例化实际的目标函数:依据参数选择不同类型,如RegressionL2loss、BinaryLogloss、MulticlassSo 阅读全文
posted @ 2019-02-02 16:21 bytedance 阅读(642) 评论(0) 推荐(0) 编辑

2018年9月17日

摘要: FM模型: 公式:2-way FMs (d=2) 1) w_0是全局bias; 2)w_i描述特征x_i的强度; 3)w_i_j描述了特征x_i与x_j之间的关联; 参数估计: 计算复杂度: O(kn^n) --> O(kn) 模型训练:梯度下降 延伸:d-way FM FM与SVM的关系: 优点: 阅读全文
posted @ 2018-09-17 19:38 bytedance 阅读(153) 评论(0) 推荐(0) 编辑

2018年8月26日

摘要: 背景 facebook上的广告并不是与query关联的,而是与用户的兴趣及其人口信息相关,所以相比于搜索其候选广告的体量要大的多; 级联模型:解决上述大量候选集合的问题,逐级增大计算复杂度; 实验: 评估方法: 1.归一化互信熵:y-->(-1,+1) 2.Calibration:预测点击数/观测点 阅读全文
posted @ 2018-08-26 21:25 bytedance 阅读(539) 评论(0) 推荐(0) 编辑

2018年7月24日

摘要: 概述:隐式语义模型将query与document映射到低维空间,把二者的相关性问题转化为低维空间向量的距离。DSSM使用深度结构实现此映射过程,同时提出word hashing技术使得模型适用于大规模数据 经典的隐式语义模型: 概述:隐式语义模型将query与document映射到低维空间,把二者的 阅读全文
posted @ 2018-07-24 14:53 bytedance 阅读(2807) 评论(0) 推荐(0) 编辑

2018年7月12日

摘要: 总览 用途:文本分类 优点:在精度上与深度学习的方法媲美,但更高效,速度快多个数量级。 模型结构 fastText的结构:输入为一个句子的N个词(ngram)的向量和表示,训练之前单个词向量可利用随机数进行初始化,随后将这些词向量加权平均得到对应文本的向量表示;输出为文本对应的标签。此模型结构与CB 阅读全文
posted @ 2018-07-12 17:45 bytedance 阅读(501) 评论(0) 推荐(0) 编辑

2018年7月9日

摘要: 总览 搜索引擎的六个核心组件:爬虫、解析、索引、链接关系分析、查询处理、排名 信息检索中的代表性排序模型: 1)传统的排序模型:两类 1. 相关性排序模型: a) Boolean model: 基于查询term在文档里出现的情况,但不能预测相关性的程度 b)Vectos Space Model: 在 阅读全文
posted @ 2018-07-09 22:09 bytedance 阅读(4351) 评论(0) 推荐(0) 编辑

2018年6月15日

摘要: 树模型 应用场景:1.分类 2.回归 步骤:特征选择+树的生成+剪枝 分类应用中的树模型等价于if-then规则的集合or定义在特征空间与类空间的条件概率分布,可解释性强 概念: 1. 熵:表示随机变量的不确定程度,其数值越大,则随机变量的不确定性也越大 2.条件熵:表示在已知随机变量X的条件下随机 阅读全文
posted @ 2018-06-15 10:30 bytedance 阅读(795) 评论(0) 推荐(0) 编辑

2018年6月11日

摘要: 特征挖掘的框架 频繁特征挖掘基本概念 1.频繁项集、频繁子序列、频繁子结构 2.关联规则: 购物篮问题:电脑-->反病毒软件[支持度support=2%, 置信读confidence=60%],表示所有交易数据中有2%的记录在购买了电脑与反病毒软件被同时购买,而所有购买了电脑的用户中,有60%的用户 阅读全文
posted @ 2018-06-11 13:22 bytedance 阅读(2223) 评论(0) 推荐(1) 编辑

2018年6月6日

摘要: 内存地址 区分三种不同的地址: 1.逻辑地址:机器语言指令中指定操作书或指令的地址,由段和偏移量构成 2.线性/虚拟地址:应用程序的地址 3.物理地址:在内存芯片上的寻址地址 逻辑地址转换:内存控制单元MMU利用分段单元将逻辑地址转换为虚拟地址,再由分页单元将其转化为物理地址 硬件中的分段 逻辑地址 阅读全文
posted @ 2018-06-06 12:59 bytedance 阅读(161) 评论(0) 推荐(0) 编辑

摘要: 结构 阅读全文
posted @ 2018-06-06 11:14 bytedance 阅读(198) 评论(0) 推荐(0) 编辑