上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 40 下一页
摘要: 相似向量的召回是推荐系统中召回阶段中非常重要的一个步骤,便利所有向量的召回方法性能太差,KD树先对向量空间进行了切分,只需要检索部分向量空间就可以获得检索结果,大大加快了检索效率。 如果实例点是随机分布的,kd树的时间复杂度是O(logN) KD 树的构造 1. 选择切分向量空间的维度,常用的有两种 阅读全文
posted @ 2021-07-18 15:51 AI_Engineer 阅读(227) 评论(0) 推荐(0)
摘要: 1. 背景与核心思想 FTRL 是一种基于在线学习(Online Learning)的优化算法,最初由 Google 提出并应用于大规模稀疏场景(如推荐系统、广告点击率预测)。其核心思想是: 结合自适应学习率:根据历史梯度调整不同参数的学习率,类似 RMSprop/Adam 的二阶矩机制。 显式正则 阅读全文
posted @ 2021-07-16 21:12 AI_Engineer 阅读(196) 评论(0) 推荐(0)
摘要: 01背包问题 问题描述 有一个容量为 V 的背包,和一些物品。这些物品分别有两个属性,体积 v 和价值 w(都大于0),每种物品只有一个。要求用这个背包装下价值尽可能多的物品,求该最大价值。 1. 背包可以不被装满 for (int i=0; i<N; i++) { for (int j=v[i]; 阅读全文
posted @ 2021-07-15 20:12 AI_Engineer 阅读(43) 评论(0) 推荐(0)
摘要: 后验概率与条件概率区别 后验概率就是一种条件概率,但是与其它条件概率的不同之处在于,它限定了目标事件为隐变量取值,而其中的条件为观测结果。 一般的条件概率,条件和事件都可以是任意的。 贝叶斯公式就是由先验概率求后验概率的公式 举例区分普通条件概率与后验概率的区别: 1)那么如果我们出门之前我们听到新 阅读全文
posted @ 2021-03-30 17:32 AI_Engineer 阅读(603) 评论(0) 推荐(0)
摘要: 背景 在广告或推荐中,用户的行为序列是一类非常重要的特征(如用户最近购买的商品序列),在以往的工作中我们一般是直接对序列特征求sumpooing(如下图base model),这个方案存在两个缺点: 1. 假设当前候选广告为上衣,用户的历史购买序列包含了裤子、帽子、洗衣机、电视等,直观上可以看出裤子 阅读全文
posted @ 2021-03-26 18:14 AI_Engineer 阅读(273) 评论(0) 推荐(0)
摘要: 中心极限定理 定义 简单理解 我们重复的从均值为μ的分布中抽取n个样本(n要足够大),那么每次抽取的n个样本的均值服从均值为μ的正太分布 大数定理 随着样本容量n的增加,样本平均数将接近于总体平均数(期望 μ),所以在统计推断中,一般都会使用样本平均数估计总体平均数的值。 阅读全文
posted @ 2021-03-08 12:41 AI_Engineer 阅读(186) 评论(0) 推荐(0)
摘要: 左值和右值 C++对于左值和右值没有标准定义,但是有一个被广泛认同的说法: 可以取地址的,有名字的,非临时的就是左值; 不能取地址的,没有名字的,临时的就是右值; 可见立即数,函数返回的值等都是右值;而非匿名对象(包括变量),函数返回的引用,const对象等都是左值。 从本质上理解,创建和销毁由编译 阅读全文
posted @ 2020-09-14 10:26 AI_Engineer 阅读(388) 评论(0) 推荐(0)
摘要: UDP协议 相较于TCP而言,UDP通信的形式更像是发短信。不需要在数据传输之前建立、维护连接。只专心获取数据就好。省去了三次握手的过程,通信速度可以大大提高,但与之伴随的通信的稳定性和正确率便得不到保证。因此,我们称UDP为“无连接的不可靠报文传递”。 那么与我们熟知的TCP相比,UDP有哪些优点 阅读全文
posted @ 2020-06-22 23:36 AI_Engineer 阅读(179) 评论(0) 推荐(0)
摘要: 代码: #include <stdlib.h> #include <pthread.h> #include <unistd.h> #include <assert.h> #include <stdio.h> #include <string.h> #include <signal.h> #inclu 阅读全文
posted @ 2020-06-22 15:16 AI_Engineer 阅读(123) 评论(0) 推荐(0)
摘要: IO多路复用(IO Multiplexing)一种同步IO模型,单个进程/线程就可以同时处理多个IO请求。一个进程/线程可以监视多个文件句柄;一旦某个文件句柄就绪,就能够通知应用程序进行相应的读写操作;没有文件句柄就绪时会阻塞应用程序,交出cpu。多路是指网络连接,复用指的是同一个进程/线程。一个进 阅读全文
posted @ 2020-06-20 17:46 AI_Engineer 阅读(282) 评论(0) 推荐(0)
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 40 下一页