2013 年 6月随笔档案 - 94julia

读书笔记-------修炼之道互联网产品从设计到运营

摘要：互联网产品—从设计到运营(一) 把握互联网产品时代的机会机遇：1一个优势互补的优秀团队 2富有激情、坚持不懈的互联网精神 3 瞄准商业模式传统网站衡量指标PULSE:PageView(页面访问次数)、Uptime(持续运行时间)、Latency（延迟）、SevenDaysActiveUser（7天活跃用户）、Earning(收入)Google用户体验师提出HEART框架：Happiness（愉悦感）、Engagement（参与度）、Adoption（接受度）、Retention（留存率）、TaskSuccess(任务完成率)。资源：www.masar.cn 玛撒网多个微博、SNS同步更新工具阅读全文

posted @ 2013-06-13 19:25 94julia 阅读(1413) 评论(0) 推荐(1)

Mahout之（一）数据承载

摘要：Mahout之（一）数据承载推荐数据的处理是大规模的，在集群环境下一次要处理的数据可能是数GB，所以Mahout针对推荐数据进行了优化。Preference在Mahout中，用户的喜好被抽象为一个Preference，包含了userId，itemId和偏好值（user对item的偏好）。Preference是一个接口，它有一个通用的实现是GenericPreference。因为用户的喜好数据是大规模的，我们通常会选择把它放入集合或者数组。同时，由于Java的对象的内存消耗机制，在大数据量下使用Collection<Preference>和Preference[]是非常低效的。为什么阅读全文

posted @ 2013-06-06 17:29 94julia 阅读(266) 评论(0) 推荐(0)

Hadoop——认识篇

摘要：Hadoop有两部分组成：HDFS（Hadoop DistributedFile System, Hadoop分布式文件系统）MapReduce1. HDFSHadoop分布式文件系统由一个管理节点（NameNode）和N个数据节点（DataNode）组成，每个节点均是一台普通的计算机。其底层实现为：把文件切割成若干个Block，然后把这些Block分散存储于不同的DataNode上，每个Block还可以复制数份存储于不同的DataNode上，达到容错容灾的目的。NameNode则是整个HDFS的核心，它通过维护一些数据结构，记录了每一个文件被切割成了多少个Block，这些Block可以从哪些阅读全文

posted @ 2013-06-06 17:16 94julia 阅读(223) 评论(0) 推荐(0)

94julia

06 2013 档案

公告