随笔分类 -  大数据

摘要:目录一、 业务视角:我们要“做什么”? (The "What")1. 打通数据孤岛 (Data Unification) - 解决“连接”问题2. 构建标签体系 (Tagging System) - 解决“画像”问题3. 赋能业务场景 (Activation) - 解决“变现”问题二、 技术视角:架 阅读全文
posted @ 2025-11-22 20:37 向着朝阳 阅读(4) 评论(0) 推荐(0)
摘要:目录背景和价值参考资料 背景和价值 https://it.sohu.com/a/781308284_120082794 感觉是我能找到的目前最适合开发人员的调度系统了。该项目常用于数据流开发。比如数据清洗、dataset预处理、数据采集、ai训练等场景。 参考资料 阅读全文
posted @ 2025-09-13 11:24 向着朝阳 阅读(4) 评论(0) 推荐(0)
摘要:目录背景和价值参考资料 背景和价值 中小企业,使用 neo4j 就够了 如果对实时性有极高的要求,使用纯内存的 Memgraph 生产海量数据使用 NebulaGraph https://zhuanlan.zhihu.com/p/1934579376080532306 参考资料 阅读全文
posted @ 2025-08-19 15:20 向着朝阳 阅读(8) 评论(0) 推荐(0)
摘要:动态标签计算 “分析用户行为数据生成动态用户标签”是一个“数据采集→特征提取→标签计算→动态更新→存储调用”的全链路工程,核心要解决实时性、准确性、动态性三个问题。具体技术实现可拆解为以下步骤: 一、行为数据的多源实时采集:构建标签的“原料池” 动态标签的基础是“及时获取用户行为信号”,需要覆盖全场 阅读全文
posted @ 2025-07-20 10:38 向着朝阳 阅读(135) 评论(0) 推荐(0)