摘要: 原文 1. 背景 在 jstack 的内容中可以看到以下的 MySQL Statement Cancellation Timer 守护线程, 在业务高峰期的时候会出现大量的这类守护线程, 由此追溯该线程的生命周期过程; "MySQL Statement Cancellation Timer" #20 阅读全文
posted @ 2021-03-05 18:55 01码匠 阅读(1587) 评论(0) 推荐(1) 编辑
摘要: 原文 全文目录 机器学习技术的实施方法 预测阶段效果监控 离线预测+在线预测 监控点击率的稳定性 真实点击率的稳定性 计算相邻两个区间内点击率分布的 PSI(Population Stability Index, 群体稳定性指标), 小于 0.1 可认为数据相对稳定; 预测点击率的稳定性 与系统本身 阅读全文
posted @ 2021-03-05 12:21 01码匠 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 原文 全文目录 机器学习技术的实施方法 特征处理 特征工程的重要性 需要同时掌握理论方法和业务逻辑才能提取有效的特征; 在特征方面拥有最大的自主性和探索性; 指征能力, 该特征的大小变化对最终结果的大小变化会在什么方向起到多大的作用; 用户ID类特征 ID特征, 指为每个用户分配一个唯一ID, 将这 阅读全文
posted @ 2021-03-05 12:19 01码匠 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 原文 全文目录 机器学习技术概述 让计算机在没有被显示编程的情况下具有自主学习的能力; 学习出特征和目标之间具体的相关性; 学习结果的用法: 预测, 推断(inference); 推荐系统中的应用场景 推荐系统的本质是匹配; 推荐结果排序 传统的方式是利用公式来定义排序规则, 机器学习是选择具有良好 阅读全文
posted @ 2021-03-05 12:18 01码匠 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 原文 全文目录 关联规则算法, 由于限制较大, 所以相关性较强, 但覆盖率较低; 协同过滤算法, 覆盖率更高, 相关性较差; 以上两者基于行为, 有冷启动问题, 所以需要内容相关性算法来托底; 三种算法的融合得出最终的结果; 数据血统: 对数据的来源进行记录与分析的相关数据和过程; 线性加权融合 \ 阅读全文
posted @ 2021-03-05 12:17 01码匠 阅读(263) 评论(0) 推荐(1) 编辑
摘要: 原文 全文目录 相关性召回+点击率排序 推荐逻辑流程架构 根本任务: 匹配 匹配过程步骤: 相关性召回, 对用户做360度全方位扫描, 尽量多的描述和覆盖用户可能感兴趣的高质量的物品; 候选集融合, 重点关注多样性和相关性的均衡, 召回算法的优先级等问题; 结果排序, 按照某一确定目标进行排序; 业 阅读全文
posted @ 2021-03-05 12:16 01码匠 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 原文 全文目录 多组件, 多模块, 多数据源构成; 涉及用户, 物品, 行为, 上下文等数据; 计算形式包括大数据平台上的批量计算/挖掘/训练, 流式数据的实时处理, 线上的实时服务; 核心逻辑拆解 核心目的: 为用户找当前场景下最具相关性的物品或物品集合; 以用户兴趣为轴: \[ P(item|u 阅读全文
posted @ 2021-03-05 12:13 01码匠 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 声明, 本文仅作为读书笔记目录整理使用. 原文 目录 第 1 章 推荐系统的时代背景 2021年3月5日 第 2 章 推荐系统的核心技术概述 2021年2月20日 第 3 章 基础推荐算法 2021年2月22日 第 4 章 算法融合与数据血统 2021年2月23日 第 5 章 机器学习技术的应用 上 阅读全文
posted @ 2021-03-05 09:27 01码匠 阅读(398) 评论(0) 推荐(0) 编辑
摘要: 全文目录 原文 推荐系统存在必要性 流量利用 流量的四个特点: 稀缺性, 在流量红利退去之后, 部分市场近似零和游戏, 获取流量成本不断增加; 不确定性, 引入用户后如何判断用户来到该网站的意图, 以便进一步针对性的营销活动, 满足用户需求并提高用户体验; 差异性, 基于用户个性, 所处情境不同; 阅读全文
posted @ 2021-03-05 09:19 01码匠 阅读(355) 评论(0) 推荐(0) 编辑