随笔分类 - 大数据
摘要:目录一、 业务视角:我们要“做什么”? (The "What")1. 打通数据孤岛 (Data Unification) - 解决“连接”问题2. 构建标签体系 (Tagging System) - 解决“画像”问题3. 赋能业务场景 (Activation) - 解决“变现”问题二、 技术视角:架
阅读全文
摘要:目录背景和价值参考资料 背景和价值 https://it.sohu.com/a/781308284_120082794 感觉是我能找到的目前最适合开发人员的调度系统了。该项目常用于数据流开发。比如数据清洗、dataset预处理、数据采集、ai训练等场景。 参考资料
阅读全文
摘要:目录背景和价值参考资料 背景和价值 中小企业,使用 neo4j 就够了 如果对实时性有极高的要求,使用纯内存的 Memgraph 生产海量数据使用 NebulaGraph https://zhuanlan.zhihu.com/p/1934579376080532306 参考资料
阅读全文
摘要:动态标签计算 “分析用户行为数据生成动态用户标签”是一个“数据采集→特征提取→标签计算→动态更新→存储调用”的全链路工程,核心要解决实时性、准确性、动态性三个问题。具体技术实现可拆解为以下步骤: 一、行为数据的多源实时采集:构建标签的“原料池” 动态标签的基础是“及时获取用户行为信号”,需要覆盖全场
阅读全文

浙公网安备 33010602011771号