会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
大数据技术派
关注公众号:大数据技术派,回复“资料”,领取1000G资料。
首页
联系
订阅
管理
[置顶]
程序员必备的一些数学基础知识
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 我的博客 数据仓库系列文章 数仓建模—指标体系 数仓建模—宽表的设计 数据湖是谁?那数据仓库又算什么? 数据仓库之拉链表 数仓架构发展史 数仓建模分层理论 数据仓库建模方法论 sqoop用法之mysql与hive数据导入导出 作为一个标准
阅读全文
posted @ 2021-02-10 23:53 大数据技术派
阅读(4176)
评论(6)
推荐(5)
[置顶]
数仓架构发展史
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 主要内容 发展史 时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只有放在当前的时代背景下,才是
阅读全文
posted @ 2020-12-13 12:36 大数据技术派
阅读(1995)
评论(3)
推荐(6)
[置顶]
一万三千字的HashMap面试必问知识点详解
摘要: 概论 HashMap 是无论在工作还是面试中都非常常见常考的数据结构。比如 Leetcode 第一题 Two Sum 的某种变种的最优解就是需要用到 HashMap 的,高频考题 LRU Cache 是需要用到 LinkedHashMap 的。HashMap 用起来很简单,所以今天我们来从源码的角度
阅读全文
posted @ 2020-11-28 16:24 大数据技术派
阅读(1327)
评论(7)
推荐(9)
2025年4月30日
四十种AI编程工具,让你码字如飞
摘要: 本文首发于:http://www.ikeguang.com/?p=2101 用过AI编程工具的都知道,这玩意儿虽说还有待完善,但是确实能提高效率啊,真香啊。 是这样的,最近一个同学离职,我临时接手了他的BI数据后台,我一个不会前端的人,使用AI编程工具,发送简单的指令,竟然使用Vue前后端分离,做出
阅读全文
posted @ 2025-04-30 16:31 大数据技术派
阅读(1417)
评论(4)
推荐(3)
2025年4月23日
python2安装Python包,报错 Microsoft Visual C++ 9.0 is required. Get it from http://aka.ms/vcpython27
摘要: python2安装Python包,报错 Microsoft Visual C++ 9.0 is required. Get it from http://aka.ms/vcpython27 下载这个msi文件,然后安装: https://web.archive.org/web/20210106040
阅读全文
posted @ 2025-04-23 18:30 大数据技术派
阅读(467)
评论(0)
推荐(0)
2024年3月19日
clickhouse使用心得
摘要: clickhouse目前用在实时BI后台,只要数据稳定落库了,出报表很快,临时查询也很快,在使用过程中,对它的一些优点和不足也是深有体会,这里总结一下,不能做到面面俱到,但尽可能详细的介绍实际应用需要注意的问题和应用技巧。 我们是通过编写Flink程序,消费kafka数据,将数据清洗,扩充维度,然后
阅读全文
posted @ 2024-03-19 11:08 大数据技术派
阅读(1160)
评论(2)
推荐(1)
2024年1月18日
Flink DataStream API 编程模型
摘要: Flink系列文章 第01讲:Flink 的应用场景和架构模型 第02讲:Flink 入门程序 WordCount 和 SQL 实现 第03讲:Flink 的编程模型与其他框架比较 第04讲:Flink 常用的 DataSet 和 DataStream API 第05讲:Flink SQL & Ta
阅读全文
posted @ 2024-01-18 16:29 大数据技术派
阅读(617)
评论(0)
推荐(0)
2024年1月16日
Flink异步IO
摘要: 本文讲解 Flink 用于访问外部数据存储的异步 I/O API。 对于不熟悉异步或者事件驱动编程的用户,建议先储备一些关于 Future 和事件驱动编程的知识。 对于异步 I/O 操作的需求 在与外部系统交互(用数据库中的数据扩充流数据)的时候,需要考虑与外部系统的通信延迟对整个流处理应用的影响。
阅读全文
posted @ 2024-01-16 14:01 大数据技术派
阅读(951)
评论(0)
推荐(0)
2023年4月27日
ClickHouse主键索引最佳实践
摘要: 在本文中,我们将深入研究ClickHouse索引。我们将对此进行详细说明和讨论: ClickHouse的索引与传统的关系数据库有何不同 ClickHouse是怎样构建和使用主键稀疏索引的 ClickHouse索引的最佳实践 这篇文章主要关注稀疏索引,clickhouse主键使用的就是稀疏索引。 数据
阅读全文
posted @ 2023-04-27 21:21 大数据技术派
阅读(825)
评论(0)
推荐(0)
2022年12月23日
ClickHouse数据副本引擎
摘要: 我的gitee地址:https://gitee.com/ddxygq/bigdata-technical-pai ,相关文章都放到这个仓库里了。 只有 MergeTree 系列里的表可支持副本: ReplicatedMergeTree ReplicatedSummingMergeTree Repli
阅读全文
posted @ 2022-12-23 13:44 大数据技术派
阅读(626)
评论(0)
推荐(1)
2022年12月22日
ClickHouse MergeTree引擎
摘要: Clickhouse 中最强大的表引擎当属 MergeTree (合并树)引擎及该系列(*MergeTree)中的其他引擎。 MergeTree 系列的引擎被设计用于插入极大量的数据到一张表当中。数据可以以数据片段的形式一个接着一个的快速写入,数据片段在后台按照一定的规则进行合并。相比在插入时不断修
阅读全文
posted @ 2022-12-22 10:24 大数据技术派
阅读(315)
评论(0)
推荐(0)
2022年12月14日
ClickHouse入门教程
摘要: 本文首发于我的个人博客:ClickHouse简介 什么是ClickHouse? ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 在传统的行式数据库系统中,数据按如下顺序存储: | Row | WatchID | JavaEnable | Title | Good
阅读全文
posted @ 2022-12-14 17:34 大数据技术派
阅读(1335)
评论(0)
推荐(0)
2022年12月2日
Flink SQL管理平台flink-streaming-platform-web安装搭建
摘要: 文章都在个人博客网站:https://www.ikeguang.com/ 同步,欢迎访问。 最近看到有人在用flink sql的页面管理平台,大致看了下,尝试安装使用,比原生的flink sql界面确实好用多了,我们看下原生的,通过bin/sql-client.sh命令进入那个黑框,一只松鼠,对,就
阅读全文
posted @ 2022-12-02 09:57 大数据技术派
阅读(1602)
评论(0)
推荐(3)
下一页
公告