Data'Insight

[置顶] ContextualBandits算法

摘要：前言 Bandits -> Contextual Bandits -> RL， 3个方向不断进阶。contextual bandits 相比于bandits多了特征优势，相比于RL是一步reward反馈。正好有个大佬整理了这几种算法的对比，顺便学习下。资料链接： github地址：https:// 阅读全文

posted @ 2021-06-03 16:28 Data'Insight 阅读(304) 评论(0) 推荐(0)

[置顶] ContextualBandits系列

摘要：碎碎念 Bandits, Contextual Bandits, RL。3个方向，属于不断升级。CB是一步reward的rl，相比于bandits，可以使用特征信息。最新的研究成果应该就是neural bandits了。正好看到一个github上有很不错的bandits算法对比，正好也在做这块，打算阅读全文

posted @ 2021-06-03 11:22 Data'Insight 阅读(172) 评论(0) 推荐(0)

[置顶] 读《CAN:co-action network》有感

摘要：碎碎念（借用）不得不说周国睿是个大佬，在RANK模型思考很深。达不到大佬的水平，就跟上大佬的步伐。DIN是建模U2I，CAN是建模i2i。其实CAN就是把id sequence和待预估id的共现（也就是i2i）考虑进来了。有次我问面试者一个问题，大家都在做推荐，你觉得你做推荐有什么不同呢，或者说你阅读全文

posted @ 2021-06-01 11:17 Data'Insight 阅读(1948) 评论(0) 推荐(1)

2021年11月23日

Fast Adaptation with Linearized Neural Networks

摘要： Abstract摘要训练神经网络的归纳bias很难理解导致很难适应新任务。我们研究线性化神经网络的归纳bias，取得了全神经网络函数不错的结论。我们提出了一项技术，通过来源于Jacobian of the network设计出来的kernal，将归纳bias embedding到高斯过程分布。阅读全文

posted @ 2021-11-23 10:58 Data'Insight 阅读(60) 评论(0) 推荐(0)

2020年12月16日

VAE探索

摘要：简介预定一篇VAE的博客！期待开笔。写1篇博客好难。 VI（variational inference）是属于随机推断，具体的算法有MFVI,SGVI等。 motivation: VI一直有个困惑就是如何来用，特别是在工业界上怎么来用。 https://www.sohu.com/a/226209 阅读全文

posted @ 2020-12-16 17:30 Data'Insight 阅读(102) 评论(0) 推荐(0)

开篇

摘要：简介本人是个搞机器学习和深度学习的菜鸟，啥都懂些！当今在深度学习横行的时代，越来约觉得各类深度学习（强化学习、元学习、迁移学习、图表征学习、对抗学习、multi-view/multi-task/multi-model/multi-label）算法都在讲故事，在工业界一顿操作猛如虎，一看效果0.5（阅读全文

posted @ 2020-12-16 10:48 Data'Insight 阅读(90) 评论(0) 推荐(0)

2018年4月19日

数学公式测试

摘要： $\frac{x}{t^2+\beta}$ 阅读全文

posted @ 2018-04-19 16:20 Data'Insight 阅读(93) 评论(0) 推荐(0)

动态规划

摘要：导语动态规划作为一门强有力的编程技术，一直以来在解编程题中都是利器。总感觉自己学习的时候总是学习几道题目，并没有深入理解。故打算做个动态规划专题，包括理论和题目解析。正好在学习《运筹学教程》，里面对运筹学的数学原理知识讲解较为透彻。再结合之前在算法中学习的知识，打算对动态规划做个专题总结。这是我在阅读全文

posted @ 2018-04-19 16:12 Data'Insight 阅读(295) 评论(0) 推荐(0)

公告