10 2018 档案

摘要:以前所有的Hive 函数都是 Java 或是 Scala 语言写的 ,Python 没有弄个 ,看到Python 格式的 code 懵逼了 ,非常懵逼 今天在看 Python 正则表达式偶遇 Python udf 的一个 case ,不过 Python 484... 阅读全文
posted @ 2018-10-31 18:06 yuerspring 阅读(328) 评论(0) 推荐(0)
摘要:From below log is not easy to find the root reason ,any body know that ,thx2018-10-22 03:45:41 INFO 2018-10-22 03:45:41,651 Stage-2(jo... 阅读全文
posted @ 2018-10-22 09:05 yuerspring 阅读(1412) 评论(0) 推荐(0)
摘要:记得之前用过一种办法,concat(a.col,'-',ceil(rand()*100)%20)),将记录数特别多的关联字段取模20,得到新字段a.col2;另外维护一张有20条记录的小表,小表的数据从0到19,用b表的关联字段关联这张小表得到新的字段b.col2,然... 阅读全文
posted @ 2018-10-18 17:53 yuerspring 阅读(488) 评论(0) 推荐(0)
摘要:素养1站的高,看的远投资如下棋,看不到三步,谈不上高手,真正的大师往往能看到七八步之后。最优秀的投资人能预判五年以后的行业形势,并提前布局,软银的孙正义,投资日本雅虎、阿里巴巴等就是其远见卓识的具体表现。优秀的投资人能够看到三年以后的行业形势,比如股权分置改革前购买法... 阅读全文
posted @ 2018-10-16 20:01 yuerspring 阅读(673) 评论(0) 推荐(0)
摘要:on case when a.user_id is null then concat(‘jd-hive’,rand() ) else a.user_id end = b.user_id;如果两个表join 时 关联键 有众多null 值 ,null值数据会被分发到... 阅读全文
posted @ 2018-10-16 16:05 yuerspring 阅读(534) 评论(0) 推荐(1)