摘要: 3.3 处理偏好值为空的数据(布尔偏好) 有时推荐引擎中出现偏好值为空的记录。它代表了用户和项目是关联的,但是并没有表现出关联程度。举了例子,一个新闻网站根据用户已阅读内容为用户推荐新闻。“已阅读”使一个用户和一个项目产生了关联,然而这是唯一能够获取的信息。一般网站也不会让用户去给文章做个排序,更不会让用户再做除了阅读之外的其他什么事了。所以我们仅仅知道用户和那些文章关联了,而再也没有其他的内容了。 面对这样的情形,我们别无选择。这里不会有偏好值。后续几章将会依然提供处理如此情形的技术和建议。然而有时我们忽略掉偏好值也未尝不是坏事,只要情形需要。 丢掉用户和项目之间的联系很容易,或者说我... 阅读全文
posted @ 2012-07-27 12:15 跳刀的兔子 阅读(629) 评论(0) 推荐(0) 编辑
摘要: 3.2 内存中的数据模型 DataMode是推荐器总输入数据的一种抽象。推荐算法需要用它来实现高效的访问数据。例如,DataModel可以在输入数据中提供一列用户,或者提供与某项目关联的所有偏好值,也或者提供对一个项目集合感兴趣的所有用户ID。本小节精选出一些关于DataModel的API来做一番介绍,这些API可以再官方文档中查阅到详细说明。3.2.1 GenericDataModel GenericDataModel是最简单的数据模型的实现,它是“内存版”的。当你希望在内存中构建你的数据模型时,它比较适合你,而非基于硬盘中的文件和数据库。它所接收的偏好是以FastByIDMap存储用户.. 阅读全文
posted @ 2012-07-27 12:14 跳刀的兔子 阅读(1099) 评论(0) 推荐(0) 编辑