摘要: 按照算法的类型对个人的 Paper Reading 博客进行汇总,涉及多个研究方向的论文将按照个人主观感觉的主要方向排列。 目录不平衡学习回归决策树决策森林进化计算计算机视觉计算学习理论与方法神经决策模型神经网络生物信息图学习特征工程 不平衡学习 A Novel Model for Imbalanc 阅读全文
posted @ 2023-08-17 00:19 乌漆WhiteMoon 阅读(1022) 评论(0) 推荐(2)
摘要: 目录操作系统进程管理同步与死锁存储器管理文件系统磁盘管理I/O 设备管理分布式系统参考资料 这些博客都是根据《计算机操作系统(第四版)》、《操作系统导论》、《分布式系统概念与设计》等书籍整理的,因为这些书超级厚,不爱带来带去。如果在其他地方有看到相关的感兴趣的内容,也会整理到这里来。 操作系统 操作 阅读全文
posted @ 2021-08-22 14:36 乌漆WhiteMoon 阅读(1741) 评论(0) 推荐(8)
摘要: #基础知识 CTF-WEB:PHP 弱类型 CTF-WEB:PHP 变量 CTF-WEB:PHP 伪协议 CTF-WEB:PHP 反序列化 CTF-WEB:字符串和正则匹配 CTF-WEB:后台扫描与备份泄露 CTF-WEB:BurpSuite 工具应用 CTF-WEB:文件上传和 webshell 阅读全文
posted @ 2021-07-30 12:20 乌漆WhiteMoon 阅读(2484) 评论(0) 推荐(5)
摘要: #基础理论 计算机网络这门课涵盖了 TCP/IP 协议栈的所有层,但是网络规划主要侧重于链路层(交换机)和网络层(路由器)。因此想要快速上手网络技术的学习,可以先从这些基本的理论入门。 网络技术:网络互联设备 网络技术:以太网 网络技术:网络互联模型 网络技术:IP 编址 网络技术:子网划分 #基础 阅读全文
posted @ 2021-07-23 00:21 乌漆WhiteMoon 阅读(1752) 评论(0) 推荐(2)
摘要: #数据库原理 数据库原理:数据库系统概述 数据库原理:数据模型和关系数据库 数据库原理:求最小依赖集和候选键 数据库原理:关系规范化 数据库原理:数据库设计 数据库原理:数据库恢复和并发控制 #SqlServer SQL Server 是由 Microsoft 开发和推广的关系数据库管理系统(DBM 阅读全文
posted @ 2021-06-04 21:47 乌漆WhiteMoon 阅读(1341) 评论(0) 推荐(2)
摘要: #DVWA 靶场 DVWA 靶场的网页应用程序很脆弱,它的主要目标是帮助安全专业人员在实际环境中测试他们的技能和工具,帮助 web 开发人员更好地理解保护 web 应用程序的过程,并帮助教师/学生在教室环境中教授/学习 web 应用程序安全。 Brute Force (爆破) Command Inj 阅读全文
posted @ 2020-11-19 01:54 乌漆WhiteMoon 阅读(4200) 评论(0) 推荐(2)
摘要: #预备知识 数据结构个人学习推荐 C++面向过程编程 C++ STL 库快速上手 #线性表 顺序表结构详解 链表结构和例题详解 SkipList (跳跃表)解析及其实现 静态链表及 PTA 重组链表 #栈和队列 栈结构解析及其应用 队列结构解析及其应用 栈和队列应用:迷宫问题 PTA习题解析——银行 阅读全文
posted @ 2020-08-05 00:07 乌漆WhiteMoon 阅读(1976) 评论(0) 推荐(7)
摘要: [TOC] #学习经验分享 [计算机网络个人学习经验](https://www.cnblogs.com/linfangnan/p/17017625.html) #概述 [计算机网络:互联网概述](https://www.cnblogs.com/linfangnan/p/15056612.html) 阅读全文
posted @ 2020-08-04 00:14 乌漆WhiteMoon 阅读(2519) 评论(2) 推荐(7)
摘要: 目录预备知识Q 函数排序矩阵局部特征掩码 L0 范数估计排列矩阵 P 的估计Lemma D.2.Definition D.1Theorem D.3. 在论文《ProtoGate: Prototype-based Neural Networks with Global-to-local Feature 阅读全文
posted @ 2025-11-27 09:55 乌漆WhiteMoon 阅读(19) 评论(0) 推荐(0)
摘要: ProtoGate 是一个针对高维低样本量(HDLSS)生物医学表格数据设计的创新型特征选择与分类框架,其核心在于通过一种解耦的、原型驱动的架构来同时实现高预测精度、高特征选择保真度以及内在的可解释性。首先使用全局到局部的特征选择器自适应地识别重要特征,它采用两阶段策略:先通过门控网络第一层的 L1 正则化进行“软全局选择”,快速筛选出所有样本共享的潜在重要特征集;再通过后续层的 L0 正则化进行“局部选择”,为每个样本生成个性化的稀疏特征掩码。接着使用非参数的原型预测器进行预测,该预测器将特征选择后的查询样本与训练阶段构建的“原型库”中的原型样本进行相似度比较,基于 K 个最近邻原型的多数投票得出预测结果。模型中仅特征选择器的参数是可训练的,训练损失函数由预测损失和特征选择正则化项加权构成,并通过可微排序技术使梯度能从原型预测损失顺畅地反向传播至特征选择器。 阅读全文
posted @ 2025-11-27 09:55 乌漆WhiteMoon 阅读(15) 评论(0) 推荐(0)
摘要: 受到遗忘决策树的启发,本文提出了一个用于处理表格数据深度神经网络架构 DOFEN。DOFEN 首先通过随机组合条件来构建一个庞大的、可微分的松弛 ODT 池,然后引入一个独特的两级集成策略:第一级通过随机采样 rODT 形成多个独立的森林以引入多样性并防止过拟合,第二级则将这些森林的预测结果进行聚合,最终输出预测。这种设计使 DOFEN 能够有效模拟树模型的优势,同时保持神经网络的端到端可训练性。通过在 Tabular Benchmark 上的实验,本文证明了 DOFEN 的表现不仅显著优于其他深度学习方法,而且与强大的梯度提升决策树模型具有竞争力。 阅读全文
posted @ 2025-11-11 22:03 乌漆WhiteMoon 阅读(10) 评论(0) 推荐(0)
摘要: 本文提出了一种面向细粒度图像识别的本质可解释深度学习模型——神经原型树(ProtoTree),将原型学习与决策树结构相结合。首先使用卷积神经网络(CNN)将输入图像映射为潜在特征表示;然后通过一个二叉决策树进行层次化推理,其中每个内部节点包含一个可学习的原型,通过计算图像特征与原型之间的相似度来决定路由方向(向左或向右);最终,样本以一定概率到达各个叶子节点,节点的类别分布加权汇总产生预测结果。ProtoTree 的决策过程类似于人类玩游戏时的渐进式问答(如“这只鸟有红喉咙吗?有细长喙吗?那么它是蜂鸟!”),从而实现了全局可解释性(整个树结构可被理解)和局部可解释性(单样本预测路径可追溯)。ProtoTree 在性能上显著优于同类可解释模型,在 CUB-200-2011 和 Stanford Cars 数据集上达到更高准确率的同时,将所需原型数量减少约 90%,并通过剪枝、确定性推理等技术进一步优化了解释效率。 阅读全文
posted @ 2025-11-08 22:45 乌漆WhiteMoon 阅读(12) 评论(0) 推荐(0)
摘要: 本文提出了“神经树”这一统一概念框架,用以涵盖所有旨在融合神经网络与决策树优势的机器学习模型。接着建立了一个清晰且富有洞察力的三级分类法,将现有方法划分为非混合协作、半混合借鉴与混合模型三大范畴,梳理了神经网络与决策树从独立协作到深度协同演化的技术发展路径。在此分类基础上,论文以模型可解释性为关键视角,对各类神经树技术进行了深入分析,重点分析了神经决策树在性能与可解释性之间的根本性权衡。 阅读全文
posted @ 2025-11-05 20:50 乌漆WhiteMoon 阅读(21) 评论(0) 推荐(0)
摘要: 本文提出了一种用于表格数据深度学习的架构 TabNet,该模型的核心创新在于模仿决策树的特征选择能力,通过一种序列注意力机制(sequential attention)来实现实例级的软特征选择。在每一步决策中,TabNet 都会动态地、稀疏地选择最相关的特征子集进行推理,从而将模型的学习能力集中在最显著的特征上。这不仅提高了学习效率,减少了冗余参数,还自然地为模型提供了内在的可解释性。其编码器由多个决策步骤组成,每个步骤包含一个用于特征选择的注意力变换器(Attentive Transformer)和一个用于特征处理的特征变换器(Feature Transformer)。此外,TabNet 首次为表格数据引入了掩码自监督学习框架,通过预测被掩码的特征来进行预训练,从而能够有效利用大量未标注数据来提升模型在下游任务中的性能。通过广泛的实验验证,证明了TabNet 在多个不同领域的分类和回归数据集上达到或超越了当前主流表格学习模型的性能,同时提供了局部和全局两个层面的可解释性。 阅读全文
posted @ 2025-11-04 20:15 乌漆WhiteMoon 阅读(65) 评论(0) 推荐(0)
摘要: GRANDE 是一种基于梯度下降的硬性、轴对齐决策树集成模型,它通过端到端的梯度优化方法联合学习整个集成模型的所有参数。核心创新在于将决策树转化为密集可微表示,并引入了实例级权重机制,使不同决策树能够专注于处理数据的不同区域。模型采用软符号函数作为可微分分割函数,其梯度特性优于传统的 Sigmoid 和 Entmoid 函数,能为优化过程提供更合理的梯度信号。通过为每个叶节点而非整个估计器学习权重,GRANDE 实现了实例级的动态权重分配,不仅提升了模型性能还增强了局部可解释性。与需要顺序贪婪训练的传统梯度提升方法不同,GRANDE 的端到端训练方式使其能够探索更广阔的假设空间,同时避免了过度拟合问题。通过在 19 个基准数据集上的实验,结果表明其性能优于 XGBoost、CatBoost 等当前最优方法。 阅读全文
posted @ 2025-11-02 17:38 乌漆WhiteMoon 阅读(15) 评论(0) 推荐(0)
摘要: 本文提出的 SREDT 模型融合了符号回归与决策树的优势,其核心思想是在决策树构建过程中,将传统的轴平行分割替换为通过符号回归发现的丰富数学表达式分割。SREDT 基于 CART 算法框架,但在每个节点分割时不再局限于单特征阈值比较,而是使用 GP 驱动的符号回归来探索特征间的复杂非线性关系,使 SREDT 能够发现那些需要多个传统分割才能近似表达的复杂决策边界。这种设计在保持决策树可解释性结构的同时,大幅提升模型的表达能力和效率。通过在 65 个数据集上的系统实验证明其在准确率、F1 分数和推理时间上均优于传统决策树和斜决策树,同时保持了高度可解释性。 阅读全文
posted @ 2025-10-29 19:32 乌漆WhiteMoon 阅读(33) 评论(0) 推荐(0)
摘要: 本文提出了双变量决策树模型,通过限制每个决策节点最多使用两个特征,在保持可解释性的同时显著提升了传统决策树的表达能力。为了学习双变量决策树结构,本文提出了两种算法:基于贪心递归划分的快速算法(双变量 CART);以及基于交替优化的较慢但更好的算法(双变量 TAO)。基于贪心递归划分的双变量 CART 算法实现了快速训练,基于交替优化的双变量 TAO 算法则通过全局目标函数优化产生更优树结构。模型采用特征成本正则化机制,允许节点自适应选择零变量(剪枝)、单变量或双变量分裂类型,其中双变量分裂通过线性组合两个特征有效捕捉特征交互效应,避免了单变量树需要复杂锯齿状分割逼近决策边界的问题,同时克服了多变量树因使用过多特征而丧失可解释性的缺陷。 阅读全文
posted @ 2025-10-28 16:12 乌漆WhiteMoon 阅读(10) 评论(0) 推荐(0)
摘要: 本文提出了一种名为 GradTree 的决策树算法,实现了对硬、轴对齐决策树所有参数的联合优化。通过一种新颖的稠密决策树表示法,将离散的树参数(如分裂特征索引和阈值)转化为连续、可微的矩阵形式。为了克服决策树固有的不可微性挑战,GradTree 运用了直通算子和 entmax 变换,使得在前向传播中保持硬决策的同时,在反向传播中能够计算梯度并进行有效的参数更新。这种方法本质上将深度学习的梯度下降优化引入到了决策树的学习中,使得模型能够跳出传统贪心算法局部最优的局限,寻找泛化性能更好的解。在多个数据集上对 GradTree 进行了经验评估,GradTree 在二分类任务上优于对比方法,并在多类数据集上取得了有竞争力的结果。 阅读全文
posted @ 2025-10-27 15:31 乌漆WhiteMoon 阅读(12) 评论(0) 推荐(0)