摘要: Maven 多模块项目是通过一个 父 POM(packaging=pom) 聚合多个子模块的架构模式: 父 POM 负责:统一版本管理、插件配置、全局属性、依赖声明 子模块通过 <parent> 继承父配置,通过 <modules> 被聚合 子模块之间可通过 <dependency> 相互引用,Ma 阅读全文
posted @ 2026-04-24 17:35 ---江北 阅读(4) 评论(0) 推荐(0)
摘要: 根据您提供的最新信息(截至2026年4月),Databricks的核心产品与核心能力已从早期的“大数据平台”全面进化为一个**统一的“数据+AI”湖仓一体(Lakehouse)平台**,其核心能力可概括为以下五大支柱: ### **1. Lakehouse 架构(核心基石)**这是Databrick 阅读全文
posted @ 2026-04-23 16:31 ---江北 阅读(31) 评论(0) 推荐(0)
摘要: 核心概念: 阅读全文
posted @ 2026-03-25 15:26 ---江北 阅读(3) 评论(0) 推荐(0)
摘要: 模型推荐:claude opus、gpt 阅读全文
posted @ 2026-03-23 10:25 ---江北 阅读(5) 评论(0) 推荐(0)
摘要: 核心概念: origin:是 Git 对「远程仓库」的默认别名(alias)。当你通过 git clone 克隆一个仓库时,Git 会自动将远程仓库地址命名为 origin,方便后续操作(比如推送、拉取代码)。你可以理解为「远程仓库的昵称」。master:是远程仓库中的一个分支名称(通常是默认主分支 阅读全文
posted @ 2026-02-28 17:29 ---江北 阅读(18) 评论(0) 推荐(0)
摘要: 总体代码流程 获取一个执行环境 加载/创建初始数据 指定数据上的转换 指定计算结果放在哪里 触发程序执行 实例pom: <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" 阅读全文
posted @ 2026-02-03 15:31 ---江北 阅读(24) 评论(0) 推荐(0)
摘要: 好的,这是一个非常经典且重要的 Java 知识点。你给出的这行代码巧妙地结合了**匿名类**、**泛型**和**常量声明**。 我们来详细拆解一下: ```java// 常量修饰符 泛型类型声明 常量名 匿名类(核心)static final OutputTag<SensorReading> LOW 阅读全文
posted @ 2026-01-21 15:16 ---江北 阅读(18) 评论(0) 推荐(0)
摘要: 使用flink自带的 InputStream inputStream = ParameterTool.class.getClassLoader() .getResourceAsStream("application.properties"); ParameterTool params = Param 阅读全文
posted @ 2026-01-20 13:17 ---江北 阅读(8) 评论(0) 推荐(0)
摘要: 切记注意类型的问题! 数据视图: 当业务逻辑比较复杂时,需要将多层嵌套写在DML语句中,但是这种方式定位问题比较困难。此时,您可以通过定义数据视图的方式,将多层嵌套写在数据视图中,简化开发过程。 --源表 CREATE TEMPORARY TABLE datagen_source ( name VA 阅读全文
posted @ 2026-01-12 17:21 ---江北 阅读(10) 评论(0) 推荐(0)
摘要: 小智来给你拆一拆:在 MaxCompute(以及 Hive/Spark 等开源引擎)里,**ON 与 WHERE 的“生效时机”不同**,直接决定能不能把过滤条件“推”到最底层,从而少读数据、少 shuffle、少花钱。下面把原理 → 最佳实践 → 跨平台差异一次讲透,方便你以后横展到任何大数据平台 阅读全文
posted @ 2026-01-09 10:24 ---江北 阅读(18) 评论(0) 推荐(0)
TOP