摘要:
[导读]最新研究称,自从数千年前我们开始了愚钝的农垦生活之后就失去了变得更聪明的进化压力,人类的智力或许正在逐渐的出现退化。 腾讯科学讯(过客/编译)发表于11月12日《遗传学趋势》杂志上的这项研究辩论称自从数千年前我们开始了愚钝的农垦生活之后就失去了变得更聪明的进化压力。斯坦福大学的一位研究人员也是这项研究的合著者杰拉德-克拉布特里在一份声明中说道:“我们的智力发展和数千种智力基因的最佳化或许... 阅读全文
随笔档案-2012年11月
数据、信息与知识、思想之间的关联
2012-11-14 17:17 by vlnk, 712 阅读, 收藏,
摘要:
信息,抽象的说,就是可信的数据。那么这里和数据最大的区别就在于,一个是客观,一个是主观。例如你用尺子量桌子长宽。那么的出的值是数据。这是客观存在的,无论你的尺子是英制还是公制。但对于你而言,你实际上,不会 关心实际的长度。通常你会说,我需要个更长的桌子,或者这个桌子,家里放不下,太大了,得买个小的。你不会说,小二,来两尺的桌子。这种主观对客观数据的接受和再描述,就是信息。信息是主观的,数据是客观的抽象表征符号。信息时是数据内涵的意义,数据是对客观对象的表示。数据泛指对客观事物的数量、属性、位置及其相互关系的抽象表示。数据要通过人们约定俗成的字符和定义表现出来。不同国家的人对于关键词的约定必然会 阅读全文
大数据分析师
2012-11-14 17:16 by vlnk, 385 阅读, 收藏,
摘要:
在整个数据行业里面,ParAccel是久负名气的。他们通过了一些渠道获得不少犯罪数据,并对15000个有犯罪前科的人进行跟踪,从而向执法机构提供了参考性较高的犯罪预测。 ParAccel颠覆了Hadoop的神话。ParAccel的CEO Chuck Berger指出,太多创业公司陷入了“大数据=非结构化数据的大数据=Hadoop”的逻辑。除了非结构化数据和半结构化数据以外,结构化数据也在快速增长... 阅读全文
建模分析
2012-11-14 17:13 by vlnk, 480 阅读, 收藏,
摘要:
因素之间存在着相互依赖又相互制约的关系,通常是复杂的非线性关系。 为了分析其相互作用机制,揭示内部规律,可根据理论推导,或对观测数据的分析,或依据实践经验,设计一种模型来代表所研究的对象。 模型分析 数据分析和模型 Codd根据处理数据的范围、用户-分析人员的交互需要、多维分析需求及现有工具的支持等因素,将数据分析模型分为四种模型: 1.绝对模型(categorical model); ... 阅读全文
信息检索和网络数据挖掘领域中常用模型和基础技术
2012-11-14 17:00 by vlnk, 286 阅读, 收藏,
摘要:
来源: ChinaKDD 引子: 对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。 我所处的领域是关于网络数据的处理(国际会议WWW, SIGIR, CIKM, WSDM, ACL, ... 阅读全文
数据挖掘七步走
2012-11-14 16:58 by vlnk, 379 阅读, 收藏,
摘要:
来源:网易博客 写写我对数据挖掘过程的体会吧! Step1.商业理解 就是商业问题的理解了,那么如何更好的理解“老大”提出的商业问题困惑呢?我觉得思维导图倒是个不错的选择,当然自己要想更好的理解“老大”的意思还需要进一步的沟通,商业问题的理解关系到这个挖掘项目的价值,甚至成败,所以在这块大家要显得“外向”一些,多交流、多沟通、多了解这个商业问题背后的东东; step2.字段提取... 阅读全文
常规商业问题分析的角度
2012-11-14 16:57 by vlnk, 251 阅读, 收藏,
摘要:
来源:一休论坛 统计分析给您以先机,分析报告给您后见之明,数据挖掘给您以洞察,数据挖掘--市场调研--统计分析构成企业日常商业分析的完美循环。 1、多维度分析:从多个不同的角度及其组合去分析数据; 2、趋势分析:从时间序列分析随时间的变化趋势,找出其规律,如移动平均、同比、环比等; 3、意外分析:从大量历史数据中找出太高、太低、变化幅度过大等异常情况数据,支持预警显示、... 阅读全文
大数据三两事之大数据不是只有Hadoop
2012-11-14 16:55 by vlnk, 614 阅读, 收藏,
摘要:
来源:商业价值 这里主要讲大数据应用场景以及和传统方案的区别等,希望能够帮大家理清些大数据的概念性问题。 上图中,精确数据是指每条数据都有着准确的含义和确定的价值,表达很明确的信息。比如,制造业的一条生产记录。传统关系型数据库以处理这类数据。并基于此类数据通过复杂逻辑分析推演出业务价值为强项。 大数据时代数据的特点是大量模糊数据。单条数据没有确定的价值和明确的含义。比如,一个网页... 阅读全文
Teradata分析架构服务整合所有类型的数据
2012-11-14 16:54 by vlnk, 344 阅读, 收藏,
摘要:
源自:IT专家网 导语: Teradata咨询服务部副总裁Dave Klumb表示:“当业务数据分析与业务优先级一致时,企业就可以凭借明确的信息做出决策。如果二者不一致,那么企业就会不可避免地基于不完整的信息做出决策,或者基于对所发生的事及其原因的错误理解做出决策。”为了能够统一客户看待业务、信息、应用和系统的视图,Teradata新推出的分析架构服务,试图通过提供一套新的、基于特定行业的解决... 阅读全文
行业跟踪画布和竞品分析画布
2012-11-14 16:52 by vlnk, 5266 阅读, 收藏,
摘要:
如果决定做一款产品,那么分析一下这个产品所处的行业及发展状况是非常有必要的。我们需要知道这个行业的具体情况,从而定位我们的产品,产品所处的行业在很大程度上决定了产品最终的发展状况。 做行业分析,我们要重点分析下面几个问题:行业是朝阳行业还是夕阳行业?市场是红海还是蓝海?这个行业经历了几次发展,有哪些重要的转折点?是否有技术变革的趋势?有哪些新趋势能够带来行业变化? 行业跟踪画布 行业分析的最... 阅读全文
IBM在北京成立了全球首个大数据智慧赋能中心
2012-11-14 16:50 by vlnk, 161 阅读, 收藏,
摘要:
基于大数据的时代北京和企业用户的广泛需求,今日IBM在北京成立了大数据智慧赋能中心,并且在该领域进行全方面资源的配置,技术专家、测试专家、跨行业实践的大数据专家等聚力协助IBM中国大数据团队。 据悉,此次在北京建立全球首个大数据智慧赋能中心的举措意味着IBM立足中国市场,以及IBM对中国市场的重视。 阅读全文
IBM的大数据战略
2012-11-14 16:50 by vlnk, 200 阅读, 收藏,
摘要:
IBM大数据网站(http://www-01.ibm.com/software/data /bigdata/)是一大资源。 IBM仍是大数据和分析领域的大玩家。 IBM在2007年收购了商业智能领域的重量级公司 Cognos; IBM还在2005年收购了 Ascential软件公司,因此为IBM带来了抽取、转换和加载(ETL)产品DataStage及其他资产。 收购Cognos之前,IBM... 阅读全文
大数据的新定义【来源:腾讯科技】
2012-11-14 16:49 by vlnk, 228 阅读, 收藏,
摘要:
前雅虎中国总经理、新浪微博社区委员会专家成员谢文表示,人们在大数据的认识上有几个误区:第一,只是从量上说,光看到数据的增长,没法说清楚普通数据和大数据的区别。数据大绝对不等于大数据。现有的设备、技术方法所能处理的多数是数据大,不是大数据。数据挖掘、精细化运营、精准广告、个性化服务、推广这些不是未来大数据服务商业模式的主要部分。第二,脱离产业发展和社会进步的大背景,单纯地鼓励讨论大数据无法说明其重要... 阅读全文
数据分析价值
2012-11-14 16:49 by vlnk, 209 阅读, 收藏,
摘要:
Facebook通过复杂的追踪和分析技术,能判断出一个用户最少需要多少个Facebook好友才有可能成为长期用户。于是Facebook在其产品设计中,尽量让用户在一个可以接受的时间跨度内找到足够多的联系人。 在线视频租赁公司Netflix的数据科学家们可以判断出,当一个客户在租看多少部电影后将有可能发展成长期客户。Paypal和美国运通则依赖数据分析来进行欺诈检测,减少信用欺诈。 网络游戏公司... 阅读全文
Facebook数据科学家需具备的六大技能
2012-11-14 16:47 by vlnk, 585 阅读, 收藏,
摘要:
http://www.ctocio.com/ccnews/8199.html 数据科学家到底应该具备哪些技能?对于这个新兴职业的定位和展望,我们也许Facebook的招聘说明中找到答案。 Facebook近日公开招募数据科学家,负责分析Facebook拥有的全球最大的人际关系数据库。在Facebook的数据科学家招聘说明中,数据科学家被归类到“软件工程职业”,但实际上Facebook的数据... 阅读全文
如何进行需求分析和挖掘?
2012-11-14 16:26 by vlnk, 433 阅读, 收藏,
摘要:
源自:中国自学编程网(www.zxbc.cn) 其实这个问题不应该成为一个问题,因为一个真正意义上的的项目经理是不需要去做需求分析的,而应该是让专职的需求分析人员去做。我 的理 解,项目经理在工作过程中,与需求沾边的工作应该是对于项目范围的定义:确定哪些是在项目中要做的,哪些是不用去理会它的,清楚地定义项目的边界。除此之 外,其它的工作都应该交由专门的人员去进行专业的信息采集与处理。但大家都知道... 阅读全文
杂谈数据分析
2012-11-14 16:15 by vlnk, 199 阅读, 收藏,
摘要:
现在做产品,尤其是互联网产品,大家都重视数据的采集和挖掘,用数据驱动产品的设计、迭代。但是每种方法都有自身的局限性,下面我就用户反馈和竞品分析跟大家分享一下我的经验。 一般来说,一款产品发布后都要根据用户的反馈不断的改进产品。但是如果过分看中用户的反馈,最后会发现产品的功能会越来越多,越来越臃肿,甚至最后发现产品大的方向都在改变——如果出现这种问题,就需要好好反省一下,是不是被一小部分用户给“忽... 阅读全文
数据分析的一些误区
2012-11-14 15:31 by vlnk, 387 阅读, 收藏,
摘要:
1.忽略沉默的数据二战时英国空军为了降低飞机的损失,决定给飞机的机身进行装甲加固。由于当时条件所限,只能用装甲加固飞机上的少数部位。他们对执行完轰炸任务返航的飞机进行仔细的观察、分析、统计。发现大多数的弹孔,都集中在飞机的机翼上;只有少数弹孔位于驾驶舱。从数据上说, 加固机翼的性价比最高. 但实际情况缺恰恰相反, 驾驶舱才是最应加固的地方, 因为驾驶舱被击中的飞机几乎都没飞回来. "发声"的数据是最好获取的, 但如果没把这些沉默的数据考虑进来, 那么这种数据分析是不靠谱的。 在某些场合下,被你忽略的沉默信息,恰恰是关键信息。很多人会忽视这类关键的沉默信息,反而重视一些显眼, 阅读全文
大数据简史
2012-11-14 15:24 by vlnk, 556 阅读, 收藏,
摘要:
译自:ChinaKDD数据革命--日益增长的大型传感器、数码设备、企业数据库,和社交媒体网站--改变了一切,仅仅过去两年就新增了90%的数据。从营销人员到政策制定者都已开始接纳诸如大规模数据集和大数据之类松散的定义了。1887-- 1890美国统计学家赫尔曼·霍尔瑞斯为了统计1890年的人口普查数据发明了一台电动器来读取卡片上的洞数,该设备让美国用一年时间就完成了原本耗时8年的人口普查活动,由此在全球范围内引发了数据处理的新纪元。1935-1937美国总统富兰克林•罗斯福利用社会保障法开展了美国政府最雄心勃勃的一项数据收集项目,IBM最终赢得竞标,即需要整理美国的2600万个员工和3 阅读全文
浙公网安备 33010602011771号