随笔分类 -  dremio

上一页 1 2 3 4 5 6 7 ··· 22 下一页

dremio
dremio 数据集自动提升处理简单说明
摘要:dremio 对于数据集自动提升可以通过ui,也可以通过sql,当然rest api 也是可以的,目前sql 使用起来相对简单,但是缺少一些配置参数 sql 模式参考命令 // 当前推荐的模式 ALTER TABLE s3.dalong.demo REFRESH METADATA AUTO PROM 阅读全文

posted @ 2024-05-04 08:00 荣锋亮 阅读(38) 评论(0) 推荐(0)

dremio 读取 jsonl 格式支持
摘要:实际上属于dremio 社区一个问题,内部实际上是dremio 对于格式化插件支持的问题, 不少是基于文件格式硬编码的,尽管 我们可以自定义格式化插件,但是对于已经支持的就有点不是很方便了,可以直接复用现有的,以下说明下修改以及处理 直接修改JSONFormatPlugin 代码支持jsonl 参考 阅读全文

posted @ 2024-05-02 11:31 荣锋亮 阅读(28) 评论(0) 推荐(0)

使用@lakehouse-rs/flight-sql-client nodejs api 快速访问dremio 服务
摘要:@lakehouse-rs/flight-sql-client 是基于rust 开发的node arrow flight sql client ,dremio 目前也是推荐基于arrow flight sql 的访问模式 参考代码 package.json { "name": "node-arrow 阅读全文

posted @ 2024-05-01 08:37 荣锋亮 阅读(26) 评论(0) 推荐(0)

dremio 日志配置
摘要:dremio 对于日志的配置支持基于系统属性以及环境变量的模式,对于环境变量实际上也是使用的系统属性 参考配置 系统属性 可以直接通过dremio-env 文件添加 -Ddremio.log.path=/opt/dremio/logs 环境变量 直接添加环境变量就可以了 DREMIO_LOG_DIR 阅读全文

posted @ 2024-04-30 11:44 荣锋亮 阅读(25) 评论(0) 推荐(0)

dremio The source [xxxx] is currently unavailable. Metadata is not accessible; please check node health简单说明
摘要:最近在dremio 25.0 版本碰到了一些问题,以下说明下原因以及处理 问题现象 问题 实际上此问题是执行节点报的错误,并不是协调节点的,早期一直以为是协调节点的,结果通过分析调试发现是协调节点报的错误 The source [xxxx] is currently unavailable. Met 阅读全文

posted @ 2024-04-29 08:36 荣锋亮 阅读(62) 评论(0) 推荐(0)

dremio 25.0 KVStore 升级简单说明
摘要:dremio 25.0 开始对于数据源的存储支持加密了,所以升级上稍有不同,官方给出的操作流程如下 参考处理 // 对于已经运行的,应该先stop,然后进行应用包的替换 dremio stop // 执行dremio-admin 的upgrade dremio-admin upgrade // 启动 阅读全文

posted @ 2024-04-27 08:00 荣锋亮 阅读(26) 评论(0) 推荐(0)

dremio datastore简单说明二
摘要:以前也介绍过dremio 的datastore,目前软件版主要是基于rocksdb 的kv,对于创建会基于一个的集群角色使用不同的 dremio 实际包含了好几类的KVStoreProvider 参考KVStoreProvider实现子类 可以看到包含了local,remote,trace,noop 阅读全文

posted @ 2024-04-26 08:00 荣锋亮 阅读(27) 评论(0) 推荐(0)

dremio 25.0 maven ce 依赖官方已经发布
摘要:以前写过如何基于软件包的jar 实现maven 依赖的重构,目前官方ce 依赖的包已经发布了,可以直接使用了 参考资料 https://www.cnblogs.com/rongfengliang/p/18129848 阅读全文

posted @ 2024-04-20 07:16 荣锋亮 阅读(61) 评论(0) 推荐(0)

dremio dbt ref 内部处理简单说明
摘要:dremio dbt 内部对于ref 进行了重写,可以实现一些灵活的扩展 参考处理 ref 参考实现 dbt/include/dremio/macros/builtins/builtins.sql 对于ref 进行了一些调整,可以进行一些自定义操作,核心是对于模型格式化的定义 {%- macro r 阅读全文

posted @ 2024-04-20 00:16 荣锋亮 阅读(31) 评论(0) 推荐(0)

dremio dbt 模型处理简单说明
摘要:dremio dbt adapter 在设计的时候与传统adapter 稍有不同,比如里边调整了database 名称的处理,同时因为dremio 的特殊性 对于物化的处理是先物化然后创建一个视图(table 模式的) 对于我们实际使用到的数据是在dremio 的space (或者nessie 数据 阅读全文

posted @ 2024-04-19 06:59 荣锋亮 阅读(46) 评论(0) 推荐(0)

dremio SchemaMutability 简单说明
摘要:dremio SchemaMutability 属于一个枚举,定义了schema 的可变性能力() 参考定义 public enum SchemaMutability { @Tag(1) ALL(true, true, true, true), @Tag(2) NONE(false, false, 阅读全文

posted @ 2024-04-18 11:49 荣锋亮 阅读(14) 评论(0) 推荐(0)

dremio FormatCreator 简单说明
摘要:FormatCreator 的核心职责就是进行Format plugin 的创建 核心提供的能力 如下图,目前核心是为FileSystemPlugin 提供格式化处理的能了(包含了格式识别,数据预览,格式插件查找,创建格式插件) 构造函数初始化 默认是基于了动态类发现以及加载进行系统FormatPl 阅读全文

posted @ 2024-04-17 19:49 荣锋亮 阅读(31) 评论(0) 推荐(0)

dremio No enum constant com.dremio.common.types.TypeProtos.MinorType.TIMESTAMPMICRO 问题简单说明
摘要:现象 此问题一般出现了我们对于数据源的物理表进行了反射(源表包含时间戳类型的数据),但是我们希望直接使用反射里边的parquet 文件格式数据,此时使用预览默认是可以读取parquet 数据的,但是当我们实际查询的时候发现可能提示此问题 参考异常调用链 VALIDATION ERROR: No en 阅读全文

posted @ 2024-04-17 19:48 荣锋亮 阅读(19) 评论(0) 推荐(0)

dremio 一个元数据刷新问题
摘要:以前关于dremio 元数据刷新的也简单介绍过,最近发现dremio 新版本(从24.1 版本开始)有一些调整,废弃了,所有数据集的刷新配置 只支持基于查询的元数据刷新,一些关于此调整一些说明 好处 减少了元数据刷新的时间以及对于查询的影响,可以让查询阶段的元数据处理更快了(核心是减少查询处理) 减 阅读全文

posted @ 2024-04-17 00:15 荣锋亮 阅读(60) 评论(0) 推荐(0)

基于dremio 安装包进行源码依赖包maven 私服重建的一个思路
摘要:dremio 25.0 版本已经发布了,但是如果希望自己源码构建,但是缺少一些依赖造成编译会有问题,但是我们可以直接基于官方提供的 下载包的文件进行maven 私服的重建,以下说明下简单流程 参考流程 下载软件包 这个可以从dremio 官网下载到 最好选择一个可以构建的分支本地构建下 此步骤的目的 阅读全文

posted @ 2024-04-11 18:29 荣锋亮 阅读(82) 评论(7) 推荐(0)

dremio 25.0 版本的一些问题
摘要:就是最近dremio 25.0 发布了,昨天在体验了之后似乎一些功能与实际的说明是不太一样的(也可能是社区版的问题) 一些问题 注意jdk8 不支持了,最低是jdk 11 了 nessie catalog ga 了(生产可用) 官方的说法是支持基于api 以及ALTER TABLE , ALTER 阅读全文

posted @ 2024-04-11 11:30 荣锋亮 阅读(55) 评论(0) 推荐(0)

dremio 25.0 发布
摘要:就在最近dremio 发布了25.0 版本,新的特性很多,同时也有不少历史问题的fix,完整信息可以参考官方文档 说明 等后边体验之后说明下新特性的功能 参考资料 https://docs.dremio.com/current/release-notes/version-250-releasehtt 阅读全文

posted @ 2024-04-10 10:28 荣锋亮 阅读(39) 评论(0) 推荐(0)

dbt dremio 项目代码结构简单说明
摘要:以前简单介绍过dremio dbt 扩展的特点,以下说明下代码结构 参考代码结构 dbt ├── adapters │ └── dremio │ ├── __init__.py │ ├── __version__.py │ ├── api │ │ ├── __init__.py │ │ ├── au 阅读全文

posted @ 2024-04-03 00:49 荣锋亮 阅读(43) 评论(0) 推荐(0)

dremio dbt 实现简单说明
摘要:dremio dbt adapter 是一个方便的可以通过dbt 进行dremio 模型的工程化建模工具,adapter 实现上也是按照标准的套路以下是一个关于实现的简单说明 内部实现特点 dremio 的操作基于了http 的rest api,没有使用odbc 或者flight sql 处理,这样 阅读全文

posted @ 2024-04-03 00:46 荣锋亮 阅读(28) 评论(0) 推荐(0)

dremio sqlalchemy poetry 模式包管理
摘要:比较有意思的是关于poetry setuptools entry_points 配置的,目前基于script 模式是有问题的,结果通过尝试 使用plugin 模式是可以的 参考配置 [tool.poetry.plugins."sqlalchemy.dialects"] "dremio.flight" 阅读全文

posted @ 2024-03-30 08:00 荣锋亮 阅读(12) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 7 ··· 22 下一页

导航