AikNr

2026年1月1日

Why Diffusion Models Don't Memorize: The Role of Implicit Dynamical Regularization in Training 阅读笔记

摘要： Why Diffusion Models Don’t Memorize: The Role of Implicit Dynamical Regularization in Training 阅读笔记原文：https://arxiv.org/abs/2505.17638 演讲视频：https://w 阅读全文

posted @ 2026-01-01 03:57 AikNr 阅读(32) 评论(0) 推荐(0)

2025年12月30日

attention is not what you need 阅读笔记

摘要： Attention is Not What you Need 阅读笔记一个 Causal Grassmann 架构用几何结构的 Grassmann flows 取代了自注意力机制，用于序列建模，在Wikitext-2上达到了有竞争力的困惑度，在SNLI上取得了略高的准确率，同时在理论上展示了序列长阅读全文

posted @ 2025-12-30 16:10 AikNr 阅读(89) 评论(0) 推荐(0)

2025年10月11日

GAE-广义优势估计算法介绍

摘要： GAE 的具体计算方式 GAE 是一种在强化学习中用于估计优势函数的高级技巧，它通过一个参数 λ 来巧妙地平衡偏差 (bias) 和方差 (variance)，从而得到更稳定和高效的策略更新。 1. 目标：估计优势函数 (Advantage Function) 首先，我们想估计的目标是优势函数 \( 阅读全文

posted @ 2025-10-11 00:50 AikNr 阅读(365) 评论(0) 推荐(0)

2025年8月12日

RL 随记

摘要： DAPO 裁剪偏移提高了 clip 中（1 - sita， 1+sita）的范围，减少了熵下降的速度。在高熵的状态下可以做更多的探索，高熵就是策略的随机性强，探索能力高，低熵就是随机性低，策略确定性高，偏向利用已知的高奖励动作，探索性低 clip 的上界会限制 policy 的 explorat 阅读全文

posted @ 2025-08-12 00:53 AikNr 阅读(109) 评论(0) 推荐(0)

NLP随记

摘要： NLP Note 线性神经网络搞一个损失函数，然后用梯度下降的方法，不断修改自己的参数，使得损失函数最小，即最贴近实际情况梯度下降：每次往一个梯度最大的方向移动一个步长的大小多层感知机相比于线性神经网络，加入了隐藏层（激活函数），引入了非线性变化，使得模型可以拟合一些非线性的情况 Softm 阅读全文

posted @ 2025-08-12 00:53 AikNr 阅读(40) 评论(0) 推荐(0)

前向传播 & 反向传播

摘要：深入解析：模型参数、权重、激活值与梯度的关系在神经网络的核心运作机制中，模型参数（Parameters）、权重（Weights）、激活值（Activations）和梯度（Gradients）是四个紧密相连、缺一不可的关键概念。它们共同协作，驱动着模型的学习和预测过程。简而言之，它们之间的关系阅读全文

posted @ 2025-08-12 00:52 AikNr 阅读(220) 评论(0) 推荐(0)

Attention 显存计算 & 推理训练复杂度

摘要：在深度学习中，无论是进行模型推理（Inference）还是训练（更新参数），都需要占用大量GPU显存（VRAM）。然而，这两者在显存需求和构成上存在显著差异。总体而言，模型训练所需的显存远大于推理。下面将详细解析在两个阶段中，显存分别被哪些部分占用。一、模型推理（Inference）时的显存占阅读全文

posted @ 2025-08-12 00:52 AikNr 阅读(354) 评论(0) 推荐(0)

正则化基本概念

摘要：机器学习中的正则化：通俗易懂的解释在机器学习领域，正则化 (Regularization) 是一类旨在防止模型过拟合、增强其泛化能力的关键技术。简单来说，正则化就是在模型的学习过程中，通过引入额外的信息或约束（即对模型复杂度的一种惩罚），来引导模型学习到更简单、更平滑的规律，从而避免模型对训练数据阅读全文

posted @ 2025-08-12 00:50 AikNr 阅读(258) 评论(0) 推荐(0)

2025年6月3日

Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute

摘要：基本流程核心思想目标：让小规模开源模型（如32B参数）在单GPU上达到与大型闭源模型（如671B参数）相近的性能。关键策略：内部测试时计算（Internal TTC）：训练模型进行更长的多步推理。外部测试时计算（External TTC）：在推理时生成多个候选方案，并通过验证筛选最优解。阅读全文

posted @ 2025-06-03 18:09 AikNr 阅读(123) 评论(0) 推荐(0)

2025年5月23日

全网第二细致的Verl GRPO实现拆解讲解

摘要：全网第二细致的Verl GRPO实现拆解讲解标题党致歉，纯引流观前提示，内含大量注释代码，善用左侧目录跳过可改善阅读体验如果你有一些对GRPO改进的IDEA，看完这篇文章后你将知道如何在verl里进行修改并实现自己的IDEA。本篇文章是在锝人的报告下继续撰写，主要着重于讲解verl实现中一些阅读全文

posted @ 2025-05-23 19:38 AikNr 阅读(11107) 评论(6) 推荐(4)

2024年9月7日

用户空间的系统调用是如何链接到内核空间的系统调用的——MIT6.S081学习记录

摘要：用户态的sysinfo()，首先系统会从user/user.h里找到声明，随后由链接到 usys.S 中的汇编代码来实现的。usys.S是通过usys.pl生成的。usys.S 文件定义了所有系统调用的入口点（如下），这些入口点使用 .global 指令使函数名在链接时可见。当用户程序中调用 sys 阅读全文

posted @ 2024-09-07 21:31 AikNr 阅读(59) 评论(0) 推荐(0)

2024年6月12日

iOS快捷指令——记录今天、今年已过进度的工具

摘要：起因是看到了大佬博客里面一个计时的小工具，于是也想搞一个来提醒自己珍惜时间。经过一段时间对快捷指令的摸索，最终选择了如下的方式完成：快捷指令的链接在这里给出： https://www.icloud.com/shortcuts/94d5327fddd344a6b333a454ad1c7bbe 阅读全文

posted @ 2024-06-12 16:17 AikNr 阅读(131) 评论(0) 推荐(0)

2024年5月10日

# Mit 6.824 Raft实验 2A 2B

摘要： Mit 6.824 Raft实验 2A 2B Author: Minghao Zhou 这个项目写了好久，从一点也看不懂开始，到最后debug就和回家一样自然，成就感还是很足的哈哈。看大佬的架构和代码感觉学到了很多，故在此记录一下。 \src\raft> go test -run 2A Test ( 阅读全文

posted @ 2024-05-10 22:23 AikNr 阅读(135) 评论(0) 推荐(0)

2023年11月18日

椭圆曲线

摘要：椭圆曲线简单总结写这篇文章原因是老是忘记每个符号代表什么，所以搞一个简单的对照表元素符号参考起始点 G ，可以是任意一点私钥dA 一个随机数dA 公钥QA QA = dA x G 随机数 k 消息摘要 z P点 k x G 签名 (R, S) R 是 P点的x坐标 \(S = k^{-1} 阅读全文

posted @ 2023-11-18 10:41 AikNr 阅读(52) 评论(0) 推荐(0)

2022年8月11日

Linux Shell整理小知识

摘要： Linux Shell整理小知识介绍两个命令 1. shopt shell option, 即shell的一些选项设置 [root@localhost ~]# shopt autocd off cdable_vars off cdspell off checkhash off checkjobs 阅读全文

posted @ 2022-08-11 14:49 AikNr 阅读(58) 评论(0) 推荐(0)

2022年3月17日

CVE-2021-41773 && CVE-2021-42013拆解复现

摘要： CVE-2021-41773 && CVE-2021-42013 参考了这个师傅的WP https://www.jianshu.com/p/3076d9ec68cf CVE-2021-41773 漏洞成因 Apache HTTP Server 2.4.49版本使用的ap_normalize_path 阅读全文

posted @ 2022-03-17 13:19 AikNr 阅读(1011) 评论(0) 推荐(0)

2022年3月16日

Docker基本使用方法

摘要： Docker 的基本使用方法最近在尝试复现研究CVE，docker太方便了，学了下基本的使用方法，怕忘记，记于此处 1. 容器与镜像镜像是一堆只读的文件。容器 = 镜像 + 读写层运行态的容器 = 镜像 + 读写层 + 隔离的进程空间（包含进程）我们下载镜像到本地，使用镜像创建容器，然后启阅读全文

posted @ 2022-03-16 21:19 AikNr 阅读(140) 评论(0) 推荐(1)

2022年3月1日

[HITCON 2017]SSRFme 1 Perl GET任意命令执行漏洞

摘要： [HITCON 2017]SSRFme 1 学到了perl的open中的命令执行漏洞，参考了这篇博客大佬一的博客和这篇大佬二的博客 open漏洞在perl语言中，open函数存在命令执行漏洞：如果open文件名中存在管道符（也叫或符号|），就会将文件名直接以命令的形式执行，然后将命令的结果存到与命阅读全文

posted @ 2022-03-01 23:41 AikNr 阅读(710) 评论(0) 推荐(0)

2022年2月27日

HTML编码转换

摘要： HTML实体编码转换 html中不允许使用尖括号，因为会被误认为标签，但是实际生活中我们是有使用尖括号的需求的，所以我们用一种编码的方式来代替具体的符号。即 &#加上ascii码加上分号；如a --> a html可以识别这种编码，但是js没有办法识别。故实际在注入的时候，我们可能需要使阅读全文

posted @ 2022-02-27 22:54 AikNr 阅读(977) 评论(0) 推荐(0)

2022年1月28日

无列名注入_2 [GYCTF2020]Ezsqli 1

摘要：无列名注入_2 在之前，我们使用了select `1` from (select 1，2 union select * from tableX)a这样一个形式来进行无列名注入，原理可以看我之前写的（抄的）一篇https://www.cnblogs.com/AikN/p/15725756.html 在阅读全文

posted @ 2022-01-28 02:02 AikNr 阅读(224) 评论(0) 推荐(0)

噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜噜

公告