Liuyt_61 - 博客园

公告

2017年12月3日

摘要：爬取网页时候print输出的时候有中文输出乱码例如： \\xe4\\xb8\\xad\\xe5\\x8d\\x8e\\xe4\\xb9\\xa6\\xe5\\xb1\\x80 百度了使用encode 和decode 使用codecs都不好使。应该在爬取网页read()的时候就修改编码格式还有一阅读全文

posted @ 2017-12-03 19:23 Liuyt_61 阅读(2470) 评论(0) 推荐(0)

2017年11月28日

【python】python函数式编程、高阶函数

摘要： 1、map() : python内置的高阶函数，接收一个函数f和一个list，并通过把函数f依次作用在list的每个元素上，得到一个新的list并返回。注：map()并不改变原有的list，而是返回一个新的list 2、reduce() ：内置高阶函数，接收一个函数f和一个list。f必须接收两阅读全文

posted @ 2017-11-28 17:25 Liuyt_61 阅读(238) 评论(0) 推荐(0)

2017年11月26日

【Servlet】监听器入门

摘要：阅读全文

posted @ 2017-11-26 15:00 Liuyt_61 阅读(195) 评论(0) 推荐(0)

2017年11月24日

【python】python与正则 re的主要用到的方法列举

摘要：【直接上代码】 #coding=utf-8#1、先将正则表达式的字符串形式编译为Pattern实例 #2、使用Pattern实例处理文本并获得匹配结果 #3、最后使用Match实例获得消息，进行其他操作 import re # 【1】 re.compile(string[,flag]) 将正则表达式阅读全文

posted @ 2017-11-24 23:38 Liuyt_61 阅读(372) 评论(0) 推荐(0)

2017年6月8日

<spark> hadoop/spark 集群搭建

摘要：参考的这3个文档，虽然搭建花了挺长时间也遇到挺多问题，但是这3个文档对我的帮助确实挺大，如果有兴趣的或者有需要的可以参考以下文档。 http://blog.csdn.net/wy250229163/article/details/52729608 http://blog.csdn.net/u0126 阅读全文

posted @ 2017-06-08 23:47 Liuyt_61 阅读(177) 评论(0) 推荐(0)

<spark> error：启动spark后查看进程，进程中master和worker进程冲突

摘要：启动hadoop再启动spark后jps，发现master进程和worker进程同时存在，调试了半天配置文件。测试发现，当我关闭hadoop后 worker进程还是存在，但是，当我再关闭spark之后再jps，发现worker进程依旧存在于是想起了在~/spark/conf/slaves 中配阅读全文

posted @ 2017-06-08 23:43 Liuyt_61 阅读(2047) 评论(0) 推荐(0)

<spark> ~/spark/conf/spark-default.conf 配置文件

摘要：因为看到我参考的Hadoop/spark集群搭建的文档中的都没有对 /spark-default.conf 的配置合理地对 /spark-default.conf 进行配置，能够提高执行效率先cp复制模板文件然后添加配置信息阅读全文

posted @ 2017-06-08 23:37 Liuyt_61 阅读(2850) 评论(0) 推荐(0)

<Linux> 文件夹右下角有锁，解锁

摘要： sudo chown -R $USER 文件夹路径例如：sudo chown -R $USER ~/scala 阅读全文

posted @ 2017-06-08 18:19 Liuyt_61 阅读(11106) 评论(0) 推荐(1)

2017年6月7日

hadoop/etc/hadoop 下没有mapred-site.xml，只有mapred.xml.template

摘要：默认情况下，/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件，我们要复制该文件，并命名为mapred.xml，该文件用于指定MapReduce使用的框架。复制并重命名 cp mapred-site.xml.template mapred 阅读全文

posted @ 2017-06-07 23:30 Liuyt_61 阅读(3389) 评论(0) 推荐(2)

error：hadoop 中没有etc目录

摘要： download binary 而不是 source http://hadoop.apache.org/#Download+Hadoop 阅读全文

posted @ 2017-06-07 23:07 Liuyt_61 阅读(775) 评论(0) 推荐(0)