BBBBB
摘要: 1:指定字段分隔符和行分隔符导入,参考地址:http://dev.mysql.com/doc/refman/5.1/en/load-data.htmlLOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE 'file_name' [REPLACE | IGNORE] INTO TABLE tbl_name [CHARACTER SET charset_name] [{FIELDS | COLUMNS} [TERMINATED BY 'string'] [[OPTIONALLY] ENCLOSE... 阅读全文
posted @ 2013-04-21 15:17 如是然 阅读(248) 评论(0) 推荐(0) 编辑
摘要: http://blog.jobbole.com/31281/ 阅读全文
posted @ 2013-03-11 11:42 如是然 阅读(183) 评论(0) 推荐(0) 编辑
摘要: mapreduce程序效率的瓶颈在于两点: 1:计算机性能 2:I/O操作优化优化无非包括时间性能和空间性能两个方面,存在一下常见的优化策略: 1:输入的文件尽量采用大文件 众多的小文件会导致map数量众多,每个新的map任务都会造成一些性能的损失。所以可以将一些小文件在进行mapreduce操作前进行一些预处理,整合成大文件,或者直接采用ConbinFileInputFormat来作为输入方式,此时hadoop会考虑节点和集群的位置信息,已决定将哪些文件打包到同一个单元之中。 2:合理分配map和reduce任务的数量 通过属性mapred.tasktracker.map... 阅读全文
posted @ 2013-03-10 17:42 如是然 阅读(3077) 评论(0) 推荐(0) 编辑
摘要: hadoop 命令行运行 阅读全文
posted @ 2013-03-10 00:02 如是然 阅读(814) 评论(0) 推荐(0) 编辑
摘要: 针对mapreduce的几个重要过程做了说明,并没有详细给出实现,主要目的在于帮大家打通mapreduce的脉络(如果可以的话) 阅读全文
posted @ 2013-01-05 19:59 如是然 阅读(2672) 评论(0) 推荐(1) 编辑
摘要: build hadoop eclipse插件 阅读全文
posted @ 2013-01-03 18:22 如是然 阅读(605) 评论(0) 推荐(1) 编辑
摘要: 指针和引用的区别(1)引用总是指向一个对象,没有所谓的 null reference .所有当有可能指向一个对象也由可能不指向对象则必须使用 指针.由于C++ 要求 reference 总是指向一个对象所以 reference要求有初值.String & rs = string1;由于没有所谓的 null reference 所以所以在使用前不需要进行测试其是否有值.,而使用指针则需要测试其的有效性.(2)指针可以被重新赋值而reference则总是指向最初或地的对象.(3)必须使用reference的场合. Operator[] 操作符 由于该操作符很特别地必须返回 [能够被当做as 阅读全文
posted @ 2012-05-05 01:18 如是然 阅读(597) 评论(0) 推荐(1) 编辑
摘要: 以下的内容我会持续更新(当然是我有新发现的时候);以下内容是我在网上搜索、整理、修改的而成的内容。由于很多内容都是转载了,无法追溯到源头,因此无法一一对原作者进行道谢。这几天,我查阅大量的官方的文档,对内容进行了进一步修正和说明,希望对各位有更大的帮助。同时这些依赖关系已在我项目中都进行测试,应该不会有什么问题。再次感谢网络上各位老师。如果有什么错误,烦请指正。【Spring 3.1包详解】备注:以下的jar包,如果没有特殊说明,大多数的最新版本都可以从http://ebr.springsource.com/repository/app/下载到Spring 3.1与之前的 2.X 的不一样,新 阅读全文
posted @ 2012-04-26 11:01 如是然 阅读(6518) 评论(0) 推荐(2) 编辑
摘要: 说明:一下的排序中,都是从数组下标为1的元素开始的,输入文件的第一个数位要排序的元素的个数n,后面n行为各个元素 一:快速排序 思路:对于要排序的数组arr,从arr[i]出分成两部分,arr[i]之前的元素都小于arr[i],之后的都大于arr[i],递归此过程直到不可再分 二:堆排序 思路:通过 阅读全文
posted @ 2012-04-25 16:29 如是然 阅读(192) 评论(0) 推荐(0) 编辑
摘要: MySQL5.1.x版本中引入了一项新特性EVENT,顾名思义就是事件、定时任务机制,在指定的时间单元内执行特定的任务,因此今后一些对数据定时性操作不再依赖外部程序,而直接使用数据库本身提供的功能。要查看当前是否已开启事件调度器,可执行如下SQL:SHOW VARIABLES LIKE 'event_scheduler';或SELECT @@event_scheduler;或SHOW PROCESSLIST;若显示:+-----------------+-------+| Variable_name | Value |+-----------------+-------+| e 阅读全文
posted @ 2012-03-10 00:15 如是然 阅读(47554) 评论(3) 推荐(3) 编辑