摘要: 从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。 书籍推荐 《数据仓库工具箱(第3版)——维度建模权威指南》 本书会介绍基本知识,然后逐个讨论具体实例内容,最后进行综 阅读全文
posted @ 2022-05-12 19:09 张飞的猪 阅读(548) 评论(0) 推荐(0) 编辑
摘要: 目录MongoDB创建一张表用法示例资料分享系列文章clickhouse系列文章 MongoDB MongoDB 引擎是只读表引擎,允许从远程 MongoDB 集合中读取数据(SELECT查询)。引擎只支持非嵌套的数据类型。不支持 INSERT 查询。 创建一张表 CREATE TABLE [IF 阅读全文
posted @ 2024-01-30 20:06 张飞的猪 阅读(109) 评论(0) 推荐(0) 编辑
摘要: MySQL表引擎 MySQL引擎可以对存在远程MySQL服务器上的数据执行SELECT查询。 调用格式: MySQL('host:port', 'database', 'table', 'user', 'password'[, replace_query, 'on_duplicate_clause' 阅读全文
posted @ 2024-01-28 11:04 张飞的猪 阅读(14) 评论(0) 推荐(0) 编辑
摘要: HDFS 这个引擎提供了与Apache Hadoop生态系统的集成,允许通过ClickHouse管理HDFS上的数据。这个引擎提供了Hadoop的特定功能。 用法 ENGINE = HDFS(URI, format) URI 参数是HDFS中整个文件的URI format 参数指定一种可用的文件格式 阅读全文
posted @ 2024-01-27 13:59 张飞的猪 阅读(13) 评论(0) 推荐(0) 编辑
摘要: `ChatGPT`是一个由美国的`OpenAI`公司开发的聊天机器人,它使用了大型语言模型,现在有GPT-3、GPT-3.5、GPT-4.0多个版本,目前还在快速发展,通过监督学习和强化学习进行了微调。它可以根据用户的提示执行各种语言任务,例如回答问题、编写或调试代码、创作音乐和文本等。 目前`ChatGPT`广义上已经是一个代名词,指代通过大型语言模型,开发出的智能聊天机器人,国内的大公司,目前通过大模型也出了很多相应的应用,比较出名的有百度的文心一言、阿里的通义千问、华为的盘古大模型、以及讯飞的星火等。 阅读全文
posted @ 2024-01-16 22:36 张飞的猪 阅读(70) 评论(0) 推荐(0) 编辑
摘要: ClickHouse(21)ClickHouse集成Kafka表引擎详细解析 目录Kafka表集成引擎配置Kerberos 支持虚拟列资料分享系列文章clickhouse系列文章 Kafka表集成引擎 此引擎与Apache Kafka结合使用。 Kafka 特性: 发布或者订阅数据流。 容错存储机制。 处理流数据。 老版Kafka集成表引擎参数格式: Kafka(kafka_ 阅读全文
posted @ 2024-01-12 21:04 张飞的猪 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 目录PostgreSQL创建一张表实施细节用法示例资料分享系列文章clickhouse系列文章 PostgreSQL PostgreSQL 引擎允许 ClickHouse 对存储在远程 PostgreSQL 服务器上的数据执行 SELECT 和 INSERT 查询. 创建一张表 CREATE TAB 阅读全文
posted @ 2024-01-02 20:02 张飞的猪 阅读(203) 评论(3) 推荐(0) 编辑
摘要: 目录Hive集成表引擎创建表使用示例如何使用HDFS文件系统的本地缓存查询 ORC 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询 Parquest 输入格式的Hive 表在 Hive 中建表在 ClickHouse 中建表查询文本输入格式的Hive表在Hive 中建 阅读全文
posted @ 2023-12-23 14:00 张飞的猪 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 目录创建表用法示例资料分享系列文章clickhouse系列文章 ODBC集成表引擎使得ClickHouse可以通过ODBC方式连接到外部数据库. 为了安全地实现 ODBC 连接,ClickHouse 使用了一个独立程序 clickhouse-odbc-bridge. 如果ODBC驱动程序是直接从 c 阅读全文
posted @ 2023-12-18 16:49 张飞的猪 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 目录JDBC建表用法示例JDBC表函数资料分享系列文章clickhouse系列文章 JDBC 允许CH通过JDBC连接到外部数据库。 要实现JDBC连接,CH需要使用以后台进程运行的程序 clickhouse-jdbc-bridge。 该引擎支持Nullable数据类型。 建表 CREATE TAB 阅读全文
posted @ 2023-12-11 19:26 张飞的猪 阅读(188) 评论(0) 推荐(1) 编辑
摘要: 日志引擎系列 这些引擎是为了需要写入许多小数据量(少于一百万行)的表的场景而开发的。 这系列的引擎有: StripeLog Log TinyLog 共同属性 引擎: 数据存储在磁盘上。 写入时将数据追加在文件末尾。 不支持突变操作,也就是更新。 不支持索引。 这意味着 `SELECT` 在范围查询时 阅读全文
posted @ 2023-12-04 17:06 张飞的猪 阅读(204) 评论(0) 推荐(1) 编辑