会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
于花花
新随笔
联系
订阅
管理
2025年8月3日
卷积神经网络CNN
摘要: 理解卷积运算 3Blue1Brown【官方双语】那么……什么是卷积? 数学定义 假设有一个序列\(a\)和一个序列\(b\) \(a=(1,2,3)\) \(b=(4,5,6)\) \(a,b\)的卷积也是一个序列: \[( 1 * 4, \\ 1 * 5 + 2 * 4, \\ 1 * 6 + 2
阅读全文
posted @ 2025-08-03 21:47 于花花
阅读(17)
评论(0)
推荐(0)
2025年8月2日
机器学习概念梳理
摘要: 本文旨在对机器学习模型进行一个简单的抽象,并简单介绍机器学习过程中的一些常用组件。本篇文章并不会有过深的数学概念,以及对某一组件事无巨细的教程。 核心组件 模型的数学表达 模型是一个函数 \(y=F(x;w)\) \(x\)是你的输入,可以是一段文字、一张图片、一段语音的数字化表达(矩阵、tenso
阅读全文
posted @ 2025-08-02 10:43 于花花
阅读(24)
评论(0)
推荐(0)
2025年7月25日
大模型微调概念梳理
摘要: 1. 微调方式 全参数微调(Full Fine-Tuning, FFT):调节大模型的全部参数,需要微调样本数据量充足,计算资源充足的情况下 ✅适用于复杂任务 ❌容易过拟合,计算成本高 参数高效微调(Parameter-Efficient Fine-Tuning, PEFT):调节大模型的部分参数
阅读全文
posted @ 2025-07-25 17:54 于花花
阅读(82)
评论(0)
推荐(0)
2025年7月10日
网络包接收流程——Linux
摘要: 这几天突发奇想,突然好奇数据从网线进入网卡是通过怎么样的一个流程最终才被程序读取到的,所以,特此梳理一篇文章! 1. 网卡&驱动程序&操作系统 考虑你平时编写的代码: int l = recvfrom(socketfd, buf, size, 0); 你的代码运行在操作系统上,操作系统暴露给你的AP
阅读全文
posted @ 2025-07-10 22:39 于花花
阅读(58)
评论(0)
推荐(0)
2025年6月17日
Dolphin Scheduler学习
摘要: 前言 基于3.2.2-release版本 架构图 DS的架构图貌似年久失修,和代码已经有一些偏差了,不过还是可以用作参考。 官方文档:Dolphin Scheduler 系统架构设计 Master Worker之间的服务发现 DS抽象了一个Registry作为Master和Worker节点统一的注册
阅读全文
posted @ 2025-06-17 22:59 于花花
阅读(62)
评论(0)
推荐(0)
2025年5月16日
MonetDB/X100:超流水线查询引擎
摘要: 原文:MonetDB/X100: Hyper-Pipelining Query Execution 这篇论文于2005年发表,当时超标量、高度流水线化、支持分支预测等功能的CPU慢慢成为主流,而数据库领域的通用开发技术导致编译器无法生成能够高度利用这些功能的代码,导致IPC过低。这篇论文主要探讨和解
阅读全文
posted @ 2025-05-16 08:33 于花花
阅读(31)
评论(0)
推荐(0)
2025年5月13日
Paper:列存格式的实证评估
摘要: 原文:An Empirical Evaluation of Columnar Storage Formats 本文是该论文的翻译,并非逐句翻译,只摘取了关键部分 本文论述了主流的开放标准列存储格式Parquet和ORC的实现差异、并提供了基于真实负载的有说服力的性能评估,并提出它们的不足。 介绍 关
阅读全文
posted @ 2025-05-13 23:15 于花花
阅读(63)
评论(0)
推荐(0)
2025年5月6日
Lakehouse: 统一data warehousing和高级分析的新一代开放平台
摘要: 论文原文地址 | 发表年:2021 译者:本篇中有三个持续演进的概念,Data Warehouse(数据仓库、数仓、数据仓)、Data Lake(数据湖)、Lakehouse(湖仓)。偶尔会交换使用它们的中英文名称。 TL;DR:本篇文章处于湖仓分离的两层架构广泛使用的时期,随着当时技术的不断演进以
阅读全文
posted @ 2025-05-06 08:45 于花花
阅读(63)
评论(0)
推荐(0)
2025年5月5日
Flink: 在单引擎上实现流式和批处理
摘要: 本文是Flink论文的翻译,并非通篇翻译,只摘了关键部分帮助更好的理解Flink是什么,架构如何设计。 原文:Apache Flink: Stream and Batch Processing in a Single Engine 读者最好对于流式处理系统有一些基本的认知,知道流式系统面临哪些问题,
阅读全文
posted @ 2025-05-05 14:18 于花花
阅读(61)
评论(0)
推荐(0)
2025年5月4日
SparkPaper RDD:一个内存集群计算的可容错抽象
摘要: 本文是Spark论文的翻译,并非通篇翻译,只摘了关键部分帮助更好的理解Spark是什么,架构如何设计。 原文:Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing 摘要
阅读全文
posted @ 2025-05-04 17:31 于花花
阅读(47)
评论(0)
推荐(0)
下一页
公告