随笔分类 -  dremio

上一页 1 2 3 4 5 6 7 8 ··· 22 下一页

dremio
dremio sqlalchemy 连接说明
摘要:实际上有社区已经有一个python包了,但是里边一些实现目前有一些问题(pip 包的,当然还有一些数据类型支持的问题) 我fork 进行了一些调整 一些问题 pandas 依赖 应该是pyarrow的调整,我在代码setup.py 添加了 supports_statement_cache 问题 我按 阅读全文

posted @ 2024-03-29 08:00 荣锋亮 阅读(57) 评论(0) 推荐(0)

dremio 异步读取但是没开启cache 的处理
摘要:dremio 对于文件系统支持异步读以及cache 处理,对于cache 的处理只有在开启异步读的时候 参考配置 开启异步数据访问 cache 配置 内部处理 实际上都使用的是ce cache 包中的,getAsyncByteReader 的调用,此方法是标准FileSystem的一个方法 File 阅读全文

posted @ 2024-03-28 08:00 荣锋亮 阅读(20) 评论(0) 推荐(0)

dremio QueryContext 简单说明
摘要:QueryContext 包含了查询相关的一些信息,官方代码注释说应该重名为PlanningContext,主要是在fragment contexts 中使用 接口扩展 如下图,实现了ResourceSchedulingContext以及OptimizerRulesContext 主要实例化的地方 阅读全文

posted @ 2024-03-27 08:00 荣锋亮 阅读(21) 评论(0) 推荐(0)

dremio ce kernel 提供的一些配置类
摘要:dremio ce kernel 包提供了不少对于dremio的扩展类,比如规则,parquet 读取,以及反射处理的,以下是一个简单说明 参考配置 标准的sabot-module.conf 文件 dremio: { classpath.scanning { packages += "com.dre 阅读全文

posted @ 2024-03-25 08:00 荣锋亮 阅读(13) 评论(0) 推荐(0)

dremio cloud cache 简单说明(二)
摘要:以前我介绍过关于cache 的CacheFileSystemWrapper,以下说明下关于cache 缓存以及加载的处理 参考配置 主要是在executor 节点的 services: { coordinator.enabled: false, coordinator.master.enabled: 阅读全文

posted @ 2024-03-24 08:00 荣锋亮 阅读(35) 评论(0) 推荐(0)

dremio AsyncStreamConf 简单说明
摘要:AsyncStreamConf 主要是关于异步以及cache 配置属性的参数配置,dremio 存储扩展不少都实现了此接口 参考实现 使用的地方 整体使用 存储插件基本都会使用到,包含了一些reader,同时还有文件系统的包装处理 ce CacheFileSystemWrapper 的使用 这个是d 阅读全文

posted @ 2024-03-23 08:39 荣锋亮 阅读(15) 评论(0) 推荐(0)

dremio 官方对于软件版ha 以及扩展部署的参考方案
摘要:关于dremio 实际大规模部署的记录,内容来自官方文档 dremio 组件架构参考图 此图包含了dremio 的ha 以及扩展,包含了主备Coordinator(故障转移的) 提高查询性能的Coordinator,以及进行实际查询的执行器此部署中依赖lb,共享存储(nfs 类的),zk (协调选举 阅读全文

posted @ 2024-03-22 09:28 荣锋亮 阅读(59) 评论(0) 推荐(0)

soda-data dremio 集成使用
摘要:以前简单介绍过soda 数据质量工具,以下是关于dremio 集成的一个说明 环境准备 dremio dremio 基于docker 部署,具体可以参考https://github.com/rongfengliang/dremio_cluster_docker-compose soda soda 包 阅读全文

posted @ 2024-03-22 08:00 荣锋亮 阅读(76) 评论(0) 推荐(0)

dremio 自定义登陆以及简单sso
摘要:一个简单的dremio 集成自己外部登陆的,处理方法是通过nginx 进行proxy 同时开发自己的login 服务,此服务调用的dremio login api 对于自己的登陆页面调用自己开发的login api,然后将登陆信息写入到localstorage 中,之后进行一个dremio ngin 阅读全文

posted @ 2024-03-20 12:26 荣锋亮 阅读(99) 评论(0) 推荐(0)

dremio python odbc & pandas 集成示例代码
摘要:主要是一个记录,方便后续使用 参考代码 代码 import pyodbc import pandas host = "localhost" port = "32010" user = "admin" password = "admin123" ssl = "false" schema = "s3v2 阅读全文

posted @ 2024-03-20 08:00 荣锋亮 阅读(73) 评论(0) 推荐(0)

dremio SplitOrphansCleanerService 简单说明
摘要:SplitOrphansCleanerService 目前主要是清理一些孤立的split 服务(主要是对于namespaceservice) SplitOrphansCleanerService创建 DACDaemonModule 中,可以看出是分布式master 角色启动的(实际就是master 阅读全文

posted @ 2024-03-18 08:00 荣锋亮 阅读(17) 评论(0) 推荐(0)

dremio-diagnostic-collector dremio集群分析工具
摘要:dremio-diagnostic-collector dremio集群分析工具,支持对于log 以及系统信息的获取,方便分析集群问题 说明 dremio-diagnostic-collector 是开源的,基于golang 编写,后边可以尝试下 参考资料 https://github.com/dr 阅读全文

posted @ 2024-03-16 08:00 荣锋亮 阅读(30) 评论(0) 推荐(0)

dremio starflake data reflections 简单说明
摘要:dremio 支持一类starflake data reflections ,比较有意思,以下是对于来自官方文档的一些说明 定义 starflake data reflections 就是反射会join 多个物理数据集,这些数据集部分或者全部是record-preserving join 特点 st 阅读全文

posted @ 2024-03-15 08:00 荣锋亮 阅读(29) 评论(0) 推荐(0)

dremio ControlsInjector 简单说明
摘要:ControlsInjector 在dremio 中的使用特别多,各种执行任务中都能看到它的影子 参考使用到的类 从下图可以看到使用到ControlsInjector的地方特别多,比如命令创建,fragment启动,dremio 的sql 优化器 参考实现 如下图是目前的实现类,包含了一个无操作的, 阅读全文

posted @ 2024-03-14 08:00 荣锋亮 阅读(18) 评论(0) 推荐(0)

dremio TemporaryFolderManager 简单说明
摘要:dremio 对于比较大的处理(聚合函数操作可能会触发spill,同时会方法临时文件中),对于比较频繁的job 查询可能会有不少临时文件 TemporaryFolderManager核心是为了进行这些临时文件的管理,包括清理,创建,已经对于临时异常执行器节点的文件处理,对于清理 处理dremio 没 阅读全文

posted @ 2024-03-13 08:00 荣锋亮 阅读(32) 评论(0) 推荐(0)

dremio ResultsCleanupService 服务简单说明
摘要:dremio 支持对于jobresult 的定时清理,jobresult 的清理可以减少不少存储空间,尤其查询比较多的时候,默认dremio 每个执行的查询会对于 结果集进行本地cache,同时展示使用,同时sys.job_results.<jobid> 也会使用此数据 服务创建 DACDaemon 阅读全文

posted @ 2024-03-12 08:00 荣锋亮 阅读(33) 评论(0) 推荐(0)

dremio 分布式存储配置与hdfs core-site.xml 的关系简单说明
摘要:如果了解dremio 新版本的话,推荐使用的就是分布式存储,同时dremio 也提供了不少的支持,比如hdfs,s3,nas。。。 对于分布式存储的配置,官方文档说明的是基于core-ste.xml ,如果不了解内部机制的话,可能比较疑惑,为什么需要这个配置 以下进行一些说明 分布式配置参考 min 阅读全文

posted @ 2024-03-11 08:01 荣锋亮 阅读(40) 评论(0) 推荐(0)

dremio SetOptionHandler 简单说明
摘要:SetOptionHandler 可以进行基于sql 的配置处理,以下是一个简单说明 SetOptionHandler 的创建 是在CommandCreator中 参考代码 case SET_OPTION: if (sqlNode instanceof SqlAlterTableSetOption) 阅读全文

posted @ 2024-03-10 08:00 荣锋亮 阅读(16) 评论(0) 推荐(0)

dremio SafeExit处理流程简单说明
摘要:dremio的SafeExit实现了服务的安全退出,确保job 任务可以正确处理(当服务关闭的时候,没有处理的任务可以正常处理完成),以下是一个简单 处理流程说明 整体SafeExit 说明 目前dremio对于SafeExit的处理,核心是在NodeRegistration 中处理的,具体的触发是 阅读全文

posted @ 2024-03-09 08:00 荣锋亮 阅读(19) 评论(0) 推荐(0)

dremio sys.job_results.<jobid> 内部处理简单说明
摘要:dremio 支持一种基于select * from sys.job_results.<jobid> 格式的job result 查询,实际上不是物理表,而是vds,以下是一些简单说明 参考请求图 如下,可以看出,对于上边格式的sql 查询使用的是SysFlightStoragePlugin 存储插 阅读全文

posted @ 2024-03-08 08:00 荣锋亮 阅读(28) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 7 8 ··· 22 下一页

导航