摘要:MapReduce 支持的部分数据挖掘算法MapReduce 能够解决的问题有一个共同特点:任务可以被分解为多个子问题,且这些子问题相对独立,彼此之间不会有牵制,待并行处理完这些子问题后,任务便被解决。在实际应用中,这类问题非常庞大,谷歌在论文中提到了MapReduce 的一些典型应用,包括分布式grep、URL 访问频率统计、Web 连接图反转、倒排索引构建、分布式排序等,这些均是比较简单的应用。下面介绍一些比较复杂的应用。(1)TopK 问题我们要选择一个酒店入住,有a-g个备选,每个酒店按照环境Dconf和到海滩的距离Dbeach评分的信息如下图: 在搜索引擎领域中,常常需要统计最近最热
阅读全文
摘要:原则一:养成收集的习惯 1、收集习惯给个人带来的好处 在收集过程中你会出现焦虑和解脱,难以招架和控制良好的情绪。 (1)消极情绪的来源 要做的事情总比你能做的事情多,要做的事情太多并不是引发消极情绪的根源。 你收集到工作篮中的东西都是什么呢?这些东西其实都代表着你同自己签订的协议。消极情绪都是你违反了这些协议所导致的直接后果------他们是自我信任感丧失的结果。...
阅读全文
摘要:一、准备阶段的建议: 高级的工作管理方法就是学会一套系统并付诸实施,直到将这套系统和方法融入你的工作和生活中。 通过行动使自己感觉良好,要比通过使自己感觉良好而进入一种较佳的行动状态容易的多。 当你在适当的时候考虑适当的事情,并使用恰当的工具来捕获你的新想法时,你就能显著提升工作效率,增强创造力。 在家和公司准备一个专门的工作区,只要坐在工作区里就能进入状态。 二、处理阶段:清空工作篮(...
阅读全文
摘要:利用春节假期阅读了《Getting Things Done》一书,下文整理了下阅读过程中做的读书笔记和心得。 ==GTD理论== 一、 目的: 1. 收集需要处理的事情把它置于一个脱离大脑意识的、可靠地、条理分明的系统。 2. 训练自己在获取任何“输入信息”(接手任务)的前期就进行分析和决策,以确保任何时候都由一套可以执行或者重新协调的“下一步行动”计划。 二、 所面临的问题: 在多元...
阅读全文