会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
小小的港湾
博客园
首页
新随笔
联系
订阅
管理
随笔 - 33
文章 - 0
评论 - 1
阅读 -
52991
2023年11月
工作&提升自身能力的一点思考
摘要: 最近工作不顺,有一点思考,无处记录发到这里,多是胡言乱语,对其他人有一点作用就是超出预期了 工作至今6年多了,现在做推荐算法相关工作,我却一直认为自己不擅长提升业务指标,之前简单地以为是口味不同,最近思索之后发现是能力不足,例如 面对开放问题,不懂得如何做取舍,做出当下正确的判断 面对现有的系统,不
阅读全文
posted @ 2023-11-27 23:20 小小的港湾
阅读(24)
评论(0)
推荐(0)
2023年9月
notification 论文串讲
摘要: Notification Volume Control and Optimization System at Pinterest 讲怎么用模型分配发送次数,怎么收集无偏数据,定义样本,目标是活跃和不订阅,然后求解有约束最优化问题。 非常超前 prinist做法,按周做规划,发送量相当于有一个整体的预
阅读全文
posted @ 2023-09-17 00:31 小小的港湾
阅读(104)
评论(0)
推荐(0)
2023年8月
推荐系统的冷启动
摘要: 最近看了一些资料,随手记下 ## 什么是冷启动 搜索、广告和推荐场景都会遇到的问题,机器学习模型利用已有的用户和item的点击等数据训练,有数据循环的现象(feedback loop),但新创建的item或者新注册的用户如何分发? 用户的冷启动,可以看做是用户兴趣探索的特例,在没有用户历史数据的情况
阅读全文
posted @ 2023-08-13 20:22 小小的港湾
阅读(132)
评论(0)
推荐(0)
2023年7月
Introduction to Embedding for Retrieval 向量化召回简介
摘要: # 引言 搜广推类似场景都是retrieval + ranking两阶段方式,前者用从海量候选粗选一轮,后者再用负载模型,是效果、延迟和机器资源的trade-off的产物。 retrieval广泛使用embedding + ANN方案,比起invert index 个性化更强。 # embeddin
阅读全文
posted @ 2023-07-25 21:43 小小的港湾
阅读(130)
评论(0)
推荐(0)
2023年5月
推荐算法的知识框架【更新中】
摘要: 几年前刚进入行业时,就简单认为不过是wide&deep做精排,双塔FM做召回做粗排,再加上一些周边项目,比如冷启动和多模型融合调参,就组成了一个完整的推荐系统算法部分。再回头思考这一切,不再迷失在各式各样的实现细节中,关注本质,有了更广泛的认识,分为一下几个部分。 1. 建模方法 多阶段的推荐系统如
阅读全文
posted @ 2023-05-01 19:05 小小的港湾
阅读(45)
评论(0)
推荐(0)
2023年3月
推荐系统再思考:从机器学习到深度学习
摘要: 再次回到推荐系统方向的工作, 相比几年前 2018/19 很多认知出现了变化,对我来说很有意义,写出来作为记录也分享给大家。 曾经的主流ctr模型是 deep+wide model,出自google的经典论文。 从业界的演进路线来说, 最开始是大规模LR,模型很简单,f(x) = sigmoid(w
阅读全文
posted @ 2023-03-12 00:02 小小的港湾
阅读(54)
评论(0)
推荐(0)
2022年12月
学习《统计学习方法》的一些问题
摘要: 时隔几年,再次阅读此书学习统计学习,仍然很有收获,这里列出来阅读过程中的一些问题,之后有答案了再另写一篇文章。 感知机如何判断线性可分?学习(优化)过程中根据迭代次数判断过于低效? Naive Bayes 的贝叶斯估计的先验分布是什么?怎么理解?从结论看很合理,推理的过程是从结论推导先验分布? 决策
阅读全文
posted @ 2022-12-19 23:03 小小的港湾
阅读(20)
评论(0)
推荐(0)
2020年6月
提高工作效率的shell工具
摘要: 这里记录每次新机器如何配置工作环境。 oh-my-zsh 首先是配置oh-my-zsh, https://ohmyz.sh,相较于默认的bash,它提供了更炫酷的外观和一系列很好用的插件,比如autojump,安装也极其简单,十分推荐。 tmux tmux 是管理多个会话的系统,最初使用tmux的原
阅读全文
posted @ 2020-06-07 18:02 小小的港湾
阅读(211)
评论(0)
推荐(0)
2019年6月
log loss与ctr预估
摘要: ctr预估是工业界做推荐、广告等的基本问题,下面以熟悉的推荐场景为例,目标是提高abtest的线上指标,时长、互动和留存,反应到ctr模型的评估指标,可以是auc,logloss,ngcd等,auc反映了模型区分正负例的能力,auc提高不一定对应到线上指标提示,可能只是对item的预估分更准,对一个
阅读全文
posted @ 2019-06-16 22:54 小小的港湾
阅读(2573)
评论(0)
推荐(0)
2019年2月
推荐系统
摘要: intro 问题:given context, user, return item list, 目标是用户的留存,时长 如何解决:直接建模留存是困难的,影响因素不明确;改成对直接的目标建模,ctr,cvr; 发展历程: 模型能力的提高,(auc,uauc,rigloss,预估更准确) 另一方面在考虑
阅读全文
posted @ 2019-02-09 09:53 小小的港湾
阅读(1090)
评论(0)
推荐(0)
下一页
公告
昵称:
小小的港湾
园龄:
10年6个月
粉丝:
11
关注:
0
+加关注
<
2025年6月
>
日
一
二
三
四
五
六
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
NLP
(6)
机器学习
(6)
hihocoder
(5)
recsys
(3)
工具
(3)
POJ
(2)
caspp
(2)
graphviz
(1)
google
(1)
编译
(1)
随笔分类
Machine Learning(3)
关键词提取(6)
解题报告(7)
杂项(1)
随笔档案
2023年11月(1)
2023年9月(1)
2023年8月(1)
2023年7月(1)
2023年5月(1)
2023年3月(1)
2022年12月(1)
2020年6月(1)
2020年3月(1)
2019年6月(1)
2019年2月(2)
2018年10月(1)
2018年4月(1)
2018年1月(1)
2017年5月(6)
2017年2月(1)
2016年5月(6)
2016年4月(2)
2015年2月(1)
2014年12月(2)
更多
阅读排行榜
1. CSAPP2e: Proxy lab 解答(11894)
2. CSAPP2e:Shell lab 解答(11048)
3. 【关键词提取】第二篇:数据集、实现代码介绍(5301)
4. 【关键词提取】第一篇:综述(3412)
5. log loss与ctr预估(2573)
评论排行榜
1. 【关键词提取】第二篇:数据集、实现代码介绍(1)
推荐排行榜
1. 【关键词提取】第五篇:候选词生成(下)(2)
2. 【关键词提取】第一篇:综述(1)
最新评论
1. Re:【关键词提取】第二篇:数据集、实现代码介绍
楼主你好,请问你还有数据集吗?有的话可以发一下吗?非常感谢.
我的邮箱是gzt90726@qq.com
--Chtholly
点击右上角即可分享