2013年6月4日

摘要: Hadoop版本:1.1.2集成开发平台:Eclipse SDK 3.5.1原创作品,转载请标明:http://blog.csdn.net/yming0221/article/details/9024419倒排索引(Inverted index),也常被称为反向索引、置入档案或反向档案,是一种索引方法,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是文档检索系统中最常用的数据结构。通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由. 阅读全文
posted @ 2013-06-04 20:46 yming0221 阅读(351) 评论(0) 推荐(0) 编辑

2013年6月3日

摘要: Hadoop版本:1.1.2集成开发平台:Eclipse SDK 3.5.1原创作品,转载请标明:http://blog.csdn.net/yming0221/article/details/90133811. 首先定义DFS Location(具体的环境搭建请看前面的博文)2.下面即是Hello World实例import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; i. 阅读全文
posted @ 2013-06-03 15:24 yming0221 阅读(598) 评论(0) 推荐(0) 编辑

2013年6月1日

摘要: 1,HDFS在0.21版本中hdfs-site.xml的配置内容如下:<property><name>dfs.data.dir</name><value>file:///home/hadoop/hdfs/data/</value></property><property><name>dfs.name.dir</name><value>file:///home/hadoop/hdfs/name/</value></property>以上配置在0.21版本 阅读全文
posted @ 2013-06-01 00:32 yming0221 阅读(163) 评论(0) 推荐(0) 编辑

2013年5月31日

摘要: propertydefaultdescriptionio.sort.mb100(mb)缓存map中间结果的buffer大小io.sort.record.percent0.05io.sort.mb中用来保存mapoutput记录边界的百分比,其他缓存用来保存数据io.sort.spill.percent0.8map开始做spill操作的阈值io.sort.factor10做merge操作时同时操作的stream数上限。min.num.spill.for.combine3combiner函数运行的最小spill数mapred.compress.map.outputFALSEmap中间结果是否采用压 阅读全文
posted @ 2013-05-31 11:40 yming0221 阅读(390) 评论(0) 推荐(0) 编辑

2013年5月29日

摘要: 集群环境:1 NameNode(真实主机):Linux yan-Server 3.4.36-gentoo #3 SMP Mon Apr 1 14:09:12 CST 2013 x86_64 AMD Athlon(tm) X4 750K Quad Core Processor AuthenticAMD GNU/Linux2 DataNode1(虚拟机):Linux node1 3.5.0-23-generic #35~precise1-Ubuntu SMP Fri Jan 25 17:13:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux3 DataNode2 阅读全文
posted @ 2013-05-29 15:16 yming0221 阅读(250) 评论(0) 推荐(0) 编辑

2013年5月23日

摘要: 主机环境:Linux yan-Server 3.4.36-gentoo #3 SMP Mon Apr 1 14:09:12 CST 2013 x86_64 AMD Athlon(tm) X4 750K Quad Core Processor AuthenticAMD GNU/LinuxPython版本:Python 2.7.4原创作品,转载请标明http://blog.csdn.net/yming0221/article/details/8965882Python 2还是选择Python 3?这是挺难抉择的。Python 2学习起来参考资料比较多,网上的开源的插件对Python 2支持也比Py 阅读全文
posted @ 2013-05-23 16:28 yming0221 阅读(628) 评论(0) 推荐(0) 编辑

2013年5月21日

摘要: 系统信息:Linux 3.4.36-gentoogit版本:git version 1.8.2.1原创作品,转载请标明出处。tag是什么?tag就是标签,git也有在历史状态的关键点“贴标签”的功能--一般人们用这个功能来标记发布点。我们可以用 git tag不带任何参数创建一个标签(tag)指定某个提交(commit):本地打标签git tag v*** 2bcd97c这个就是给2bcd97c的提交打一个标签,用于以后容易区分本地删除标签git tag -d v****本地的标签如何PUSH到服务器端将本地的标签push到服务器git push origin v*****从服务器端删除标签g 阅读全文
posted @ 2013-05-21 22:49 yming0221 阅读(175) 评论(0) 推荐(0) 编辑

2013年5月15日

摘要: 主机信息:Linux yan-Server 3.4.36-gentoo #3 SMP Mon Apr 1 14:09:12 CST 2013 x86_64 AMD Athlon(tm) X4 750K Quad Core Processor AuthenticAMD GNU/Linux安卓手机:小米手机1S原创作品,转载请标明第一步:启动手机,插上手机,在linux终端输入lsusb命令查询USB总线上的设备,比如我这里查询结果如下:可以看到,即开发板的设备ID号。修改文件/etc/udev/rules.d/70-android.rule文件SUBSYSTEM=="usb" 阅读全文
posted @ 2013-05-15 14:36 yming0221 阅读(1364) 评论(0) 推荐(0) 编辑

2013年5月14日

摘要: 比如我们要备份mysql中已经存在的名为linux的数据库,要用到命令mysqldump命令格式如下:[root@linuxsir01 root]# mysqldump -u root -p linux > /root/linux.sqlEnter password:在这里输入数据库的密码通过上面的命令,我们要明白两件事,首先备份数据库是要以数据库管理员的身份备份;其次:备份目的地是/root,备份的文件名是linux.sql。其实备份的位置和文件名,根据自己的情况来定。文件名可以自己来取,路径也可以自己来安排;比如我想把linux的数据库备份到/home/beinan,数据库的文件名为 阅读全文
posted @ 2013-05-14 22:46 yming0221 阅读(171) 评论(0) 推荐(0) 编辑

2013年5月10日

摘要: 我使用的是阿里云云服务器想挂载NFS用于和终端机传输数据,但是报错信息mount.nfs:access denied by server while mounting本以为是防火墙的原因,于是关闭了防火墙,问题依旧。/etc/exports设置的很简单/home/nfs *(rw,sync,no_subtree_check)查看 exports 手册中关于 secure 选项说明man exportssecure,This option requires that requests originate on an Internet port less than IPPORT_RESERV... 阅读全文
posted @ 2013-05-10 17:58 yming0221 阅读(418) 评论(0) 推荐(0) 编辑

导航