摘要: 用户标签和标签的数学描述: 标签是特征空间中的纬度 每个标签都是特征空间中的基向量,基向量之间有关联,不一定是正交的 用户画像是特征空间中的高维向量 特征工程: 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已 特征:对所需解决问题有用的属性 特征的提取、选择和构造 针对锁解决的问题 阅读全文
posted @ 2019-09-07 14:20 hotMemo 阅读(953) 评论(0) 推荐(0) 编辑
摘要: 大数据时代:3V 集中存储/集中计算依据无法处理巨大的数据量: Volume 海量数据 ,Velocity 更新频率高 ,Variety 多类别 Lambda系统架构提供了一个结合实时数据和Hadoop预先计算的数据环境的混合平台,以提供一个实时的数据视图 分层架构: 批处理层,实时处理层,服务层( 阅读全文
posted @ 2019-09-07 11:00 hotMemo 阅读(288) 评论(0) 推荐(0) 编辑