随笔分类 -  Machine Learning

摘要:最近看了一些资料,随手记下 ## 什么是冷启动 搜索、广告和推荐场景都会遇到的问题,机器学习模型利用已有的用户和item的点击等数据训练,有数据循环的现象(feedback loop),但新创建的item或者新注册的用户如何分发? 用户的冷启动,可以看做是用户兴趣探索的特例,在没有用户历史数据的情况 阅读全文
posted @ 2023-08-13 20:22 小小的港湾 阅读(156) 评论(0) 推荐(0)
摘要:# 引言 搜广推类似场景都是retrieval + ranking两阶段方式,前者用从海量候选粗选一轮,后者再用负载模型,是效果、延迟和机器资源的trade-off的产物。 retrieval广泛使用embedding + ANN方案,比起invert index 个性化更强。 # embeddin 阅读全文
posted @ 2023-07-25 21:43 小小的港湾 阅读(149) 评论(0) 推荐(0)
摘要:时隔几年,再次阅读此书学习统计学习,仍然很有收获,这里列出来阅读过程中的一些问题,之后有答案了再另写一篇文章。 感知机如何判断线性可分?学习(优化)过程中根据迭代次数判断过于低效? Naive Bayes 的贝叶斯估计的先验分布是什么?怎么理解?从结论看很合理,推理的过程是从结论推导先验分布? 决策 阅读全文
posted @ 2022-12-19 23:03 小小的港湾 阅读(27) 评论(0) 推荐(0)