saulstavo

2025年12月24日

摘要：我来通过几个具体例子讲解 nn.Embedding 的使用场景： 1. 基础示例：词嵌入 import torch import torch.nn as nn # 示例1：创建简单的词嵌入层 # 假设我们有5个词，每个词用3维向量表示 embedding = nn.Embedding(num_emb 阅读全文

posted @ 2025-12-24 21:58 saulstavo 阅读(6) 评论(0) 推荐(0)

2025年12月12日

算法随笔

摘要： ranges:sort 是sort的更安全好用的版本，但是太新，C++20，不用管，只记sort用法即可。 stringstream std::stringstream 是字符串的“流（stream）”，可以把字符串当成输入/输出流进行读写。作用类似 cin / cout，但作用对象是字符串。头文阅读全文

posted @ 2025-12-12 09:59 saulstavo 阅读(4) 评论(0) 推荐(0)

2025年11月24日

sklearn中的OneHotEncoder

摘要：先不管 LightGBM，咱先把这段 FeatureEncoder 当成一个小黑盒，看看它的 fit 到底干了啥。你问“举例讲解”，那我就给你造个最小可复现样例，按行走一遍。 1. 先假设有这样一份原始数据 X 比如你的训练集里有这些列（随便举个 5 行的小表）： LeID 性别地址-省市 Pri 阅读全文

posted @ 2025-11-24 17:10 saulstavo 阅读(13) 评论(0) 推荐(0)

2025年10月29日

问大模型CAN的co-attention

摘要： req: 如何理解嵌入向量用于构建一个微型MLP的参数（权重和偏置），一般来说MLP的权重是训练得到的 res: 你问得非常准确，这是理解CAN的关键一步。在普通MLP里，权重矩阵 W 和偏置向量 b 确实是“可训练的张量”，它们与输入无关，只在反向传播时被更新。 CAN的做法是：把“权重/偏置” 阅读全文

posted @ 2025-10-29 11:04 saulstavo 阅读(12) 评论(0) 推荐(0)

2025年10月22日

8. 字符串转换整数 (atoi)

摘要：问题请你来实现一个 myAtoi(string s) 函数，使其能将字符串转换成一个 32 位有符号整数。函数 myAtoi(string s) 的算法如下：空格：读入字符串并丢弃无用的前导空格（" "）符号：检查下一个字符（假设还未到字符末尾）为 '-' 还是 '+'。如果两者都不存在，则阅读全文

posted @ 2025-10-22 14:10 saulstavo 阅读(8) 评论(0) 推荐(0)

6. Z 字形变换

摘要：问题将一个给定字符串 s 根据给定的行数 numRows ，以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 "PAYPALISHIRING" 行数为 3 时，排列如下： P A H N A P L S I I G Y I R 之后，你的输出需要从左往右逐行读取，产生出一个新的字符串，比阅读全文

posted @ 2025-10-22 13:05 saulstavo 阅读(11) 评论(0) 推荐(0)

2025年10月19日

Diffusion

摘要：前验概率与后验概率前验概率（Prior Probability）和后验概率（Posterior Probability）是一对孪生概念，它们是贝叶斯统计思想的核心。简单地说，前验是“你原本的信念”，后验是“在看到证据之后你修正过的信念”。我们来一步步拆解。一、前验概率：在看到数据之前的信念定义阅读全文

posted @ 2025-10-19 22:37 saulstavo 阅读(23) 评论(0) 推荐(0)

l2正则化项以及torch.norm

摘要：非常好，这段代码是一个非常典型的 L2 正则化（L2 Regularization）的实现例子。我们来一步步讲清楚它的作用、为什么写成这样，以及 torch.norm(param, p=2) 的意义。一、先看这段代码在干什么 # 手动计算 L2 正则化项并加到总损失中 l2_reg = 0 f 阅读全文

posted @ 2025-10-19 22:33 saulstavo 阅读(29) 评论(0) 推荐(0)

KL散度

摘要：有两个概率分布：真实分布 P(x)：世界的真实规律；模型分布 Q(x)：我们模型预测的结果。 KL 散度衡量的就是这两个分布之间的“距离”：\(D_{KL}(P||Q) = \sum_{x}^{}{P(x)log\frac{P(x)}{Q(x)}}\). 越接近 0 → 模型越接近真实分布. 假设你阅读全文

posted @ 2025-10-19 21:57 saulstavo 阅读(32) 评论(0) 推荐(0)

2025年10月18日

3397. 执行操作后不同元素的最大数量

摘要：问题给你一个整数数组 nums 和一个整数 k。你可以对数组中的每个元素最多执行一次以下操作：将一个在范围 [-k, k] 内的整数加到该元素上。返回执行这些操作后，nums 中可能拥有的不同元素的最大数量。示例 1：输入： nums = [1,2,2,3,3,4], k = 阅读全文

posted @ 2025-10-18 14:50 saulstavo 阅读(9) 评论(0) 推荐(0)

公告