• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
暗时间&量变
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4 5 6 7 8 9 10 11 下一页

2017年8月24日

Spark大数据针对性问题。
摘要: 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 解决方案:首先是将这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP 阅读全文
posted @ 2017-08-24 10:37 WuLei吴磊 阅读(2209) 评论(0) 推荐(2)
 
 

2017年8月7日

使用Spark下的corr计算皮尔森相似度Pearson时,报错Can only zip RDDs with same number of elements in each partition....
摘要: 实现代码如上,因为Statistics.corr(RDD[Double],RDD[Double]),所以SparkSQL读取后的数据生成的dataFrame必须转换,第一步是转换成RDD[Row],Row就相当于sql查询出来的一条数据,这里也转换过多次才成功,最后百度得到可以先.cast(Doub 阅读全文
posted @ 2017-08-07 10:36 WuLei吴磊 阅读(524) 评论(0) 推荐(0)
 
 

2017年7月18日

虐翻
摘要: 问安总一个问题,“怎么样结束Spark的远程调试?” 我以为会得到一个很简单的答案,比如一个操作,一个很简单的命令什么的,但是安总给我一个沉重的打击,从原理从底层结束了我的Spark执行进程。 秀了一波华丽丽的操作,期间我插了一句嘴,“安总,filter怎么用?”我以为会给我打个比方,结果给我讲解了 阅读全文
posted @ 2017-07-18 15:22 WuLei吴磊 阅读(173) 评论(0) 推荐(0)
 
 

2017年7月13日

Spark以yarn-client提交任务时报错超时,Connection to 192.168.. /has been quiet forms while there are outstanding requests. Failed to send RPC.....
摘要: 报错信息如上,具体是运行FusionInsight给的样例SparkPi,在local环境下是可以的,但是如果以yarn-client模式就会卡住,然后120s以后超时,其实以yarn-cluster模式也是会报错的,开始在spark-default-conf 中加上了driver的spark.dr 阅读全文
posted @ 2017-07-13 19:52 WuLei吴磊 阅读(3133) 评论(0) 推荐(0)
 
 

2017年7月11日

安装FusionInsight
摘要: 1、在华为平台上下载整体客户端,不建议下载单个组件客户端,后期关联测试还是要装上的。 2、下载后需要将服务器上的客户端拷贝到本地。打开xShell,新建会话,登陆本地虚拟机上的Linux系统(192.168.56.110),然后使用远程命令 ssh root@192.168.95.41 //41~4 阅读全文
posted @ 2017-07-11 08:42 WuLei吴磊 阅读(1119) 评论(0) 推荐(0)
 
 

2017年7月5日

summaryなな
摘要: Word如果遇到有空白页不能删除的情况,将光标定位在空白页前一页的末尾,然后按Delete键就可以删除空白页了。 实时计算,强调的是实时。比如小明要查看他去年一年的消费总额度,那么当小明点下统计按钮的时候,服务器集群就在噼里啪啦的赶紧计算了,必须在小明能够忍耐的时间范围内得出结果。这种计算的背后实现 阅读全文
posted @ 2017-07-05 16:35 WuLei吴磊 阅读(144) 评论(0) 推荐(0)
 
 

2017年6月5日

2017/6Summary
摘要: 字符串转换为JSON 1、var json = eval('(' + str + ')'); 2、var json = (new Function("return " + str))(); 3、var json = JSON.parse(str); 使用JSON.parse需严格遵守JSON规范,如 阅读全文
posted @ 2017-06-05 14:28 WuLei吴磊 阅读(375) 评论(0) 推荐(0)
 
 

2017年6月4日

定义一个Rectangle类,该类提供getLength和getWidth方法。
摘要: import java.util.Comparator; /** * 定义一个Rectangle类,该类提供getLength和getWidth方法。利用图1-18中的findMax例程编写 * 一种main方法,该方法创建一个Rectangle数组并首先找出依面积最大的Rectangle对象,然后 阅读全文
posted @ 2017-06-04 16:24 WuLei吴磊 阅读(1952) 评论(0) 推荐(0)
 
“无效数字” ;java.lang.Integer cannot be cast to java.lang.String
摘要: 今天页面上突然查询不出数据,大致的sql语句是 select xx ,xxx from table a where a.lrmb in ( 6101060033, 61010503300, 61016666645 ) order by xxx desc 报错信息是"无效数字",很快就发现是lrbm这 阅读全文
posted @ 2017-06-04 15:38 WuLei吴磊 阅读(1626) 评论(0) 推荐(0)
 
 

2017年6月2日

设计一个泛型类orderedCollection
摘要: import java.util.Arrays; /** * 设计一个泛型类orderedCollection,它存储的Comparable对象的集合(在数组中), * 以及该集合的当前大小。提供public方法isEmpty,makeEmpty,insert,remove,findMin和 * f 阅读全文
posted @ 2017-06-02 14:02 WuLei吴磊 阅读(493) 评论(0) 推荐(0)
 
 
上一页 1 2 3 4 5 6 7 8 9 10 11 下一页

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3