06 2013 档案

摘要:互联网产品—从设计到运营(一) 把握互联网产品时代的机会机遇:1一个优势互补的优秀团队 2富有激情、坚持不懈的互联网精神 3 瞄准商业模式传统网站衡量指标PULSE:PageView(页面访问次数)、Uptime(持续运行时间)、Latency(延迟)、SevenDaysActiveUser(7天活跃用户)、Earning(收入)Google用户体验师提出HEART框架:Happiness(愉悦感)、Engagement(参与度)、Adoption(接受度)、Retention(留存率)、TaskSuccess(任务完成率)。资源:www.masar.cn 玛撒网 多个微博、SNS同步更新工具 阅读全文
posted @ 2013-06-13 19:25 94julia 阅读(1413) 评论(0) 推荐(1)
摘要:Mahout之(一)数据承载推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。因为用户的喜好数据是大规模的,我们通常会选择把它放入集合或者数组。同时,由于Java的对象的内存消耗机制,在大数据量下使用Collection<Preference>和Preference[]是非常低效的。为什么 阅读全文
posted @ 2013-06-06 17:29 94julia 阅读(266) 评论(0) 推荐(0)
摘要:Hadoop有两部分组成:HDFS(Hadoop DistributedFile System, Hadoop分布式文件系统)MapReduce1. HDFSHadoop分布式文件系统由一个管理节点(NameNode)和N个数据节点(DataNode)组成,每个节点均是一台普通的计算机。其底层实现为:把文件切割成若干个Block,然后把这些Block分散存储于不同的DataNode上,每个Block还可以复制数份存储于不同的DataNode上,达到容错容灾的目的。NameNode则是整个HDFS的核心,它通过维护一些数据结构,记录了每一个文件被切割成了多少个Block,这些Block可以从哪些 阅读全文
posted @ 2013-06-06 17:16 94julia 阅读(223) 评论(0) 推荐(0)