奔头儿

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2013年2月21日

摘要: 文/ 占超群 “大数据”概念于20世纪90年代被提出,最初只是对一些在一定时间内无法用传统方法进行抓取、管理和处理的数据的统称。随着时间的推移和科技的发展以及物联网、移动互联网、SNS的兴起,每年产生的数据量都以几何级数增长,《IDC Digital Universe in 2020》报告称全球产生的数据将在2020年达到40ZB(1ZB=10亿TB=100万PB)。在这急剧增长的数据面前,各... 阅读全文
posted @ 2013-02-21 12:56 奔头儿 阅读(299) 评论(0) 推荐(0) 编辑

2012年8月6日

摘要: 前两篇都是介绍Python调用C++的,换句话说,就是需要把C++封装成Python可以“理解”的类型。这篇,我打算说一下,C++怎么去调用Python脚本。其实这两者之间是相通的,就是需要可以互操作。按照惯例,先贴代码。test.cppCpp代码 <span style="font-size: x-small;">view plaincopy to clipboardprint?#include <python2.6/Python.h>#include <iostream>#include <string>void prin 阅读全文
posted @ 2012-08-06 21:03 奔头儿 阅读(3420) 评论(0) 推荐(0) 编辑

摘要: Published on InfoWorld (http://www.infoworld.com)Home > Data Management > Which freaking database should I use? > Which freaking database should I use?Which freaking database should I use?By Andrew OliverCreated 2012-08-02 03:00AMI've been in Chicago for the last few weeks setting up ou 阅读全文
posted @ 2012-08-06 12:59 奔头儿 阅读(203) 评论(0) 推荐(0) 编辑

2012年7月5日

摘要: Beyond MapReduce:谈数据流计算系统发表于 2012/02/10 由 朱宇朝2011年度的Hadoop China大会刚刚落下帷幕,这次会议的一个热点议题就是数据流计算,在MapReduce计算模型风靡全球之后,Stream Processing将会是下一个研究热点,无论是在工业界还是学术界。本文从深层次对各种典型的数据流计算系统架构及其基于的设计理念进行剖析。背景与动机背景随着当今社会数据量的日益膨胀,普通服务器组成的计算集群用于处理各种数据应用。在工业领域,像网页检索、机器翻译、广告投放等;在科研领域,像生物复杂分析、自然语言处理、气候模拟预测等。MapReduce是一种很好 阅读全文
posted @ 2012-07-05 16:07 奔头儿 阅读(785) 评论(0) 推荐(0) 编辑

2012年2月18日

摘要: uint32_t murmurhash2(const void *data, size_t len, uint32_t hash);struct MurmurHash2 { uint32_t operator()(const String& s) const { return murmurhash2(s.c_str(), s.length(), 0); } uint32_t operator()(const void *start, size_t len) const { return murmurhash2(start, len, 0); } uint32_t operator()( 阅读全文
posted @ 2012-02-18 15:24 奔头儿 阅读(155) 评论(0) 推荐(0) 编辑

2012年1月30日

摘要: 1234 阅读全文
posted @ 2012-01-30 16:38 奔头儿 阅读(84) 评论(0) 推荐(0) 编辑