上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 37 下一页
摘要: Hive外联表HBase 详细参见官网 https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration # hive内部表 创建hive表映射hbase表, 前提是hbase表不存在 drop ttt则,hbase表也会drop c 阅读全文
posted @ 2025-03-19 22:02 钱塘江畔 阅读(17) 评论(0) 推荐(0)
摘要: yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel yum 阅读全文
posted @ 2025-03-19 21:59 钱塘江畔 阅读(33) 评论(0) 推荐(0)
摘要: Traceback (most recent call last): File "pyhive.py", line 3, in <module> from pyhive import hive File "/data01/bonc_zj/test/hz/pyhive.py", line 3, in 阅读全文
posted @ 2025-03-19 21:58 钱塘江畔 阅读(20) 评论(0) 推荐(0)
摘要: scala对象 object ScalaDemo { def add(a :Int, b :Int) :Int = a + b } java代码 public class Test { public static void main(String[] args) { int add = ScalaD 阅读全文
posted @ 2025-03-19 21:55 钱塘江畔 阅读(16) 评论(0) 推荐(0)
摘要: 代理模式 为其他对象提供一个代理以控制对某个对象的访问。代理类主要负责为委托了(真实对象)预处理消息、过滤消息、传递消息给委托类,代理类不现实具体服务,而是利用委托类来完成服务,并将执行结果封装处理。 其实就是代理类为被代理类预处理消息、过滤消息并在此之后将消息转发给被代理类,之后还能进行消息的后置 阅读全文
posted @ 2025-03-19 21:54 钱塘江畔 阅读(8) 评论(0) 推荐(0)
摘要: 聚类算法有很多种,Kmeans/mean-shift,DBSCAN聚类 K-means受噪声影响大,不够精确 mean-shift受半径影响大。 【Python机器学习】Mean Shift、Kmeans聚类算法在图像分割中实战(附源码和数据集) 阅读全文
posted @ 2025-03-19 21:53 钱塘江畔 阅读(9) 评论(0) 推荐(0)
摘要: java调用python的几种用法(看这篇就够了) 阅读全文
posted @ 2025-03-19 21:49 钱塘江畔 阅读(10) 评论(0) 推荐(0)
摘要: 一般我们说微批,是指spark这种 一条stream里,如果有多个stateful之类的操作,需要一个batch一个batch 处理并造成 链越长,积累效果越厉害的 后果(假设平均链里的一个节点处理一个batch需要时间为x,链里有100个节点,那么latency至少是100x;而flink的 设计 阅读全文
posted @ 2025-03-19 21:48 钱塘江畔 阅读(7) 评论(0) 推荐(0)
摘要: 实时数据仓库的发展、架构和趋势 结合数据湖的实时数仓架构演进 阅读全文
posted @ 2025-03-19 21:45 钱塘江畔 阅读(20) 评论(0) 推荐(0)
摘要: -- UDF注意: hive中的数组类型作为 入参,udf中应写 ArrayList 而不是 String[],否则会报错 -- No matching method for class cn.com.dtmobile.hiveUdf.MyUDF with (array<string>). Poss 阅读全文
posted @ 2025-03-19 21:40 钱塘江畔 阅读(10) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 37 下一页