摘要: 熵 由来 自然界里,气体分子的扩散,是一个从有序到无序的过程,因为原先泾渭分明的两种气体分子彼此交融;水的蒸发,是一个从有序到无序的过程,因为原先有序排列的水分子变得无序;人类的学习,知识的积累与传播,也是在不断地打破原有的知识结构,形成新的认知。自然界大量的现象,都需要我们创造出一个量,用于数学的 阅读全文
posted @ 2025-09-01 19:25 bradinz 阅读(23) 评论(0) 推荐(0)
摘要: 求解大规模QPP问题,几乎是是每一种基于核方法的机器学习算法最终要面对的问题,求解器的发展也有及其长的历史,本文记录笔者学习过程中遇到的几种代表性,重要的方法。 接着,本文将继续推导其他不限于QPP的经典solver的实现细节。包括内点法等经典方法,以及现代神经网络训练使用到的adam等主流优化器。 阅读全文
posted @ 2025-08-05 20:44 bradinz 阅读(164) 评论(0) 推荐(0)
摘要: Minimind-一个开源LLM项目的代码分析1:模型结构 如果你是一名刚接触大语言模型(LLM)的初学者,很可能会在社交媒体上看到这样一个项目——MiniMind 。 这个项目实现了一个参数规模较小但功能完整的 LLM,涵盖了预训练、LoRA 微调、SFT、蒸馏以及基于人类反馈的强化学习(RLHF)等多个模块,可以说是非常难得的入门教材。 MiniMind 阅读全文
posted @ 2025-09-20 21:37 bradinz 阅读(398) 评论(2) 推荐(0)
摘要: 摘要 本篇BLOG整合了各种调参技巧, 种子的选取(玄学) 推荐两个好用的种子 random.seed(42) ,42是《银河系漫游指南》中的答案,社区反馈,这个种子确实在大多数任务下表现不错,有人说,这是因为光需要\(10^{-42}\)秒才能穿过质子的直径,也有人说,光通过水面折射42度形成彩虹 阅读全文
posted @ 2025-09-01 19:30 bradinz 阅读(88) 评论(0) 推荐(0)
摘要: 一 前置知识 1. Embedding表示语义 想想两一百多年前,第一位西方传教士来到中国清朝,面对完全陌生的汉字体系,他该如何与中国人进行初步的沟通呢?最简单的方法是:根据中间实物对应。比如,他面前有一个苹果,中国人指着苹果说“苹果”,他就把“苹果”这个词和实物苹果,以及英文单词apple对应起来 阅读全文
posted @ 2025-09-01 19:06 bradinz 阅读(47) 评论(0) 推荐(0)
摘要: 串行通信与并行通信(串行通信接口仅了解) 并行通信:两个设备之间有多个数据位同时传输 按字或字节 特点: ➢ 传输速度快,处理简单; ➢ 抗干扰能力差; ➢ 适合近距离传送; 重点:可编程定时计数器8253(简答-画图编程,方式4、5仅了解) 接线记忆: 具有三个完全相同的、独立的计数/定时器,A0 阅读全文
posted @ 2025-06-10 21:17 bradinz 阅读(32) 评论(0) 推荐(0)
摘要: I/O系统概述 I/O系统作用,一言以蔽之,就是协调高速cpu与低俗外设之间的信息交换 两种编址方式,与内存统一编址和独立编制,8086/8088采用独立编址,与内存共用地址总线,用IO/#M,信号状态区分,访问端口时仅使用地址总线的:A15~A0,可寻址的I/O端口数为64K(65536)个,I/ 阅读全文
posted @ 2025-06-10 21:16 bradinz 阅读(26) 评论(0) 推荐(0)
摘要: 存储器概述 重点关注RAM,ROM分类各个类别特点即可 一些评价指标: 存储容量 存储单元个数×每单元的二进制数位数 存取时间 实现一次读/写所需要的时间 存取周期 连续启动两次独立的存储器操作所需间隔的最小时间 可靠性,功耗 存储单元编址 存储单元的编址是指为每个存储单元分配一个唯一的地址,以便C 阅读全文
posted @ 2025-06-10 21:16 bradinz 阅读(27) 评论(0) 推荐(0)
摘要: 基本概念 助记符 目标操作数,源操作数 操作数按照种类大致分为三种 立即操作数:1234H 寄存器操作数: AX, BX, CX, DX 存储器操作数: [1234H],[BX],[SI+DI],[BP+SI],[BX+DI],[BP+BX],[SI+1234H],[DI+1234H] 寻址方式(计 阅读全文
posted @ 2025-06-10 21:15 bradinz 阅读(32) 评论(0) 推荐(0)
摘要: 微型计算机的组成 微型计算机是电子计算机的一个分支,以微 处理器(cpu)为核心 微型计算机的整体组成由下图表示: 我们本节着重了解主机系统,即:CPU,存储器,输入输出接口,总线四部分。 CPU是计算机的核心,包括三部分,运算器,控制器,寄存器组 存储器是计算机中的记忆装置 ,用于存放计算机工作过 阅读全文
posted @ 2025-06-10 21:14 bradinz 阅读(54) 评论(0) 推荐(0)
摘要: title: ssh连接服务器(阿里云ECS) date: tags: - git - ssh - github 本地生成ssh公钥与私钥 ssh-keygen -t ed25519 -f ~/.ssh/aliyun-ecs2 可以通过 open ./.ssh 打开 .ssh文件夹查看密钥情况 进入 阅读全文
posted @ 2025-05-11 21:53 bradinz 阅读(38) 评论(0) 推荐(0)