摘要: 前言 Bandits -> Contextual Bandits -> RL, 3个方向不断进阶。contextual bandits 相比于bandits多了特征优势,相比于RL是一步reward反馈。正好有个大佬整理了这几种算法的对比,顺便学习下。 资料链接: github地址:https:// 阅读全文
posted @ 2021-06-03 16:28 Data'Insight 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 碎碎念(借用) 不得不说周国睿是个大佬,在RANK模型思考很深。达不到大佬的水平,就跟上大佬的步伐。DIN是建模U2I,CAN是建模i2i。其实CAN就是把id sequence和待预估id的共现(也就是i2i)考虑进来了。有次我问面试者一个问题,大家都在做推荐,你觉得你做推荐有什么不同呢,或者说你 阅读全文
posted @ 2021-06-01 11:17 Data'Insight 阅读(1542) 评论(0) 推荐(1) 编辑
摘要: Abstract摘要 训练神经网络的归纳bias很难理解导致很难适应新任务。我们研究线性化神经网络的归纳bias,取得了全神经网络函数不错的结论。 我们提出了一项技术,通过来源于Jacobian of the network设计出来的kernal,将归纳bias embedding到高斯过程分布。 阅读全文
posted @ 2021-11-23 10:58 Data'Insight 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 简介 预定一篇VAE的博客!期待开笔。 写1篇博客好难。 VI(variational inference)是属于随机推断,具体的算法有MFVI,SGVI等。 motivation: VI一直有个困惑就是如何来用,特别是在工业界上怎么来用。 https://www.sohu.com/a/226209 阅读全文
posted @ 2020-12-16 17:30 Data'Insight 阅读(71) 评论(0) 推荐(0) 编辑
摘要: 简介 本人是个搞机器学习和深度学习的菜鸟,啥都懂些!当今在深度学习横行的时代,越来约觉得各类深度学习(强化学习、元学习、迁移学习、图表征学习、对抗学习、multi-view/multi-task/multi-model/multi-label)算法都在讲故事,在工业界一顿操作猛如虎,一看效果0.5( 阅读全文
posted @ 2020-12-16 10:48 Data'Insight 阅读(73) 评论(0) 推荐(0) 编辑
摘要: $\frac{x}{t^2+\beta}$ 阅读全文
posted @ 2018-04-19 16:20 Data'Insight 阅读(85) 评论(0) 推荐(0) 编辑
摘要: 导语 动态规划作为一门强有力的编程技术,一直以来在解编程题中都是利器。总感觉自己学习的时候总是学习几道题目,并没有深入理解。故打算做个动态规划专题,包括理论和题目解析。正好在学习《运筹学教程》,里面对运筹学的数学原理知识讲解较为透彻。再结合之前在算法中学习的知识,打算对动态规划做个专题总结。这是我在 阅读全文
posted @ 2018-04-19 16:12 Data'Insight 阅读(270) 评论(0) 推荐(0) 编辑