摘要: Data Science We define DS as Engineering + Analytics. Analytic part has alr demonstrated through another blog. This time we focus on Engineering. Wher 阅读全文
posted @ 2026-04-07 08:50 rainrzk 阅读(14) 评论(0) 推荐(0)
摘要: 1 Pipeline Data Engineering (upstream) -> Data Analytics (downstream) where the engineering part is where most work happens on, including data ingesti 阅读全文
posted @ 2026-04-04 03:16 rainrzk 阅读(6) 评论(0) 推荐(0)
摘要: 编程是一种应用科学,它和理论不一样,比谁背的多,不是比谁理解的多。 C++ 轮子 二维数组: vector<vector<int>> matrix(M, vector<int>(N, 0)); 哈希表/字典: unordered_map<int, int> m; m[key] = val; val 阅读全文
posted @ 2026-03-25 06:54 rainrzk 阅读(8) 评论(0) 推荐(0)
摘要: 数据科学分为Data Engineering和Data Analytics。这次我们讨论前者的DBMS架构部分。 1 概述 1.1 Selinger的代价优化 像MySQL,PostgreSQL就是一个DBMS。 上个世纪,Selinger提出了古老的代价优化公式(代价模型): \[\text{CO 阅读全文
posted @ 2026-03-23 06:57 rainrzk 阅读(7) 评论(0) 推荐(0)
摘要: Computational Statistics 计算统计 0 What is Statistics? There exists two main philosophic ideas for Statistics: Frequentist, and Bayesian. Frequentists assume there is a fixed, exact v 阅读全文
posted @ 2026-03-16 04:26 rainrzk 阅读(20) 评论(0) 推荐(0)
摘要: 引入 测度:积分式 \(\text d\) 后面的东西的大小就是测度的大小。\(\int s\text d F\) 的测度就是概率质量。 泛函就是多元微积分,只不过多元在这里是无穷维。 思考一个曲线,这个曲线上每个点都是一个独立的分量 \(y_i\),每个 \(y_i\) 的变化导致 \(J\) 的 阅读全文
posted @ 2026-03-09 10:56 rainrzk 阅读(17) 评论(0) 推荐(0)
摘要: 1 匈牙利算法 处理 Bipartite Graph 用的。匈牙利算法主要用来解决两个问题:求二分图的最大匹配数和最小点覆盖数。 匈牙利算法本质上最大化增广路。增广路的数量就是最大匹配的数量。增广路的定义是首尾都是未匹配点的交错路。 注意:二分图是个无向图。 1.1 最大匹配数 class Solu 阅读全文
posted @ 2026-02-23 02:49 rainrzk 阅读(6) 评论(0) 推荐(0)
摘要: Prefix Sum 1.1 Fenwick Tree Keywords: Contribution Trick 1.1.1 Classic Fenwick Just like prefix sums, we store 0 for the first index (1-based indexing). Fenwick 阅读全文
posted @ 2026-02-06 03:56 rainrzk 阅读(4) 评论(0) 推荐(0)
摘要: Introduction to Machine Learning 1 Tradition 1.1 Perceptron Formula. Error Bound Theorem. Multiclass. 1.2 Linear Regression MLE & MAP. Formula. Regularization. 1.3 kNN Graph. Overfit 阅读全文
posted @ 2025-12-11 06:11 rainrzk 阅读(18) 评论(0) 推荐(0)
摘要: 1 Groups 1.1 Definition and Basic Terms Given a set with a binary operation $ (G,\cdot) $, if it satisfies: Closure: for all $ a,b\in G $, $ a\cdot b\ 阅读全文
posted @ 2025-10-01 06:10 rainrzk 阅读(21) 评论(0) 推荐(0)