片刻的自由 - 博客园

[置顶] 导航贴

摘要：指令查询开发环境 docker json schema prompt guide 帮助文档各种目录中国计算机学会推荐国际学术会议和期刊目录（2022） SCI等评级查询 Python库网站介绍 Vega-Altair 绘图库 PyTorch 深度学习框架前端网站介绍 Element- 阅读全文

posted @ 2024-06-14 11:59 片刻的自由阅读(103) 评论(0) 推荐(1)

2026年1月10日

[斯坦福2025春季新课CS336：从头开始构建大模型]自学笔记（15-17）

摘要：详解SFT、RLHF & 详解大模型RL算法 & 详解GRPO SFT 模型输出幻觉造成的损失较小 SFT难以做到的事：让模型拒绝回答：避免输出幻觉 SFT时，少量的数据都能极大地提高模型的表现，包括让模型输出更少的harmful内容 Pre-train 和 SFT 的界限变得模糊，都是预测序列，阅读全文

posted @ 2026-01-10 12:00 片刻的自由阅读(42) 评论(0) 推荐(0)

[斯坦福2025春季新课CS336：从头开始构建大模型]自学笔记（12-14）

摘要：模型评估详解 Perplexity perplexity 表示模型是否对一部分数据足够关注使用perplexing更容易你和scaling law的曲线困惑度任务：完形填空（单词/句子） Benchmark task：考验模型对输入的理解 Massive Multitask Language U 阅读全文

posted @ 2026-01-10 11:57 片刻的自由阅读(48) 评论(0) 推荐(0)

[斯坦福2025春季新课CS336：从头开始构建大模型]自学笔记（9-11）

摘要：详解Scaling laws 缩放定律研究的关系包括：数据与表现；数据与模型大小；超参数与表现缩放定律是为了获取数据、模型超参数与表现间的关系，尽量避免大规模实验 Q：实际中，我们数据有限，重复的数据是如何影响缩放的？可以依据定律，决定训练的epoch 考虑到重复的数据价值较少。数据选择更适合缩阅读全文

posted @ 2026-01-10 11:51 片刻的自由阅读(70) 评论(0) 推荐(0)

[斯坦福2025春季新课CS336：从头开始构建大模型]自学笔记（5-8）

摘要： GPU原理与分布式训练基础 & 内核优化与Triton框架应用 Triton 在triton编程中，通常以SM为原子单位进行编程，SM内部有多个SP（streaming processor），一个SP会并行处理大量线程粒度大到小：BLock -> Warp -> Thread Block由若干Th 阅读全文

posted @ 2026-01-10 11:44 片刻的自由阅读(26) 评论(0) 推荐(0)

[斯坦福2025春季新课CS336：从头开始构建大模型]自学笔记（1-4）

摘要：大模型概述与Tokenization & 利用Pytorch搭建大模型 Tokenizer BPE (byte pair encode) 从字符级别开始，逐步合并高频的字符对。最终生成一个既能表示常见单词，又能拆解未知词的子词词汇表。可以有效控制词汇表大小，同时避免“未登录词”问题（OOV, 阅读全文

posted @ 2026-01-10 11:32 片刻的自由阅读(75) 评论(0) 推荐(0)

2025年10月26日

[ICML2023]CLIPood Generalizing CLIP to Out-of-Distributions

摘要： Background OOD泛化任务（Out-of-Distribution (OOD) Generalization）包含两类子任务：域偏移（domain shift）：指训练集和测试集分布不同，例如训练集是写实的，测试集是素描。这类问题的解决方法包括，主要是集中在训练阶段的源域上。例如：让不阅读全文

posted @ 2025-10-26 20:06 片刻的自由阅读(21) 评论(0) 推荐(0)

2025年8月26日

记录几个学习cuda编程的例子

摘要：向量加和： #include <iostream> __global__ void vectorAdd(int n, const float* a, const float* b, float* c) { int i = blockDim.x * blockIdx.x + threadIdx.x; 阅读全文

posted @ 2025-08-26 22:02 片刻的自由阅读(74) 评论(0) 推荐(0)

2025年6月5日

大模型请求参数中，不同penalty的作用和使用场景

摘要： presence_penalty：对于1个token，如果它出现在生成的文本中，则施加惩罚 \[\hat{\rm logits}_i={\rm logits}_i - {\rm presence\_penalty} * \mathbb{I}({\rm frequency}_i>0) \] 鼓励模型阅读全文

posted @ 2025-06-05 22:05 片刻的自由阅读(142) 评论(0) 推荐(0)

2025年5月25日

[ICCV2023]Inducing Neural Collapse to a Fixed Hierarchy-Aware Frame for Reducing Mistake Severity

摘要：这篇文章基于神经坍缩（Neural Collapse）现象，提出将样本的特征诱导到考虑类别层次的Simplex ETF（Equivalent Tight Frame）。首先，通过类别层次距离构建类别间的相似度。基于相似度，通过特征值分解构造固定的分类器权重向量。同时，增加隐藏层鼓励模型特征与对应类别阅读全文

posted @ 2025-05-25 22:34 片刻的自由阅读(132) 评论(0) 推荐(0)

2025年5月22日

ImageNet层次标签构建

摘要： [link] 提供了标签间的层次信息，保存在 data.json文件中，可在倒数第二个单元格点击“Download JSON”获得 data.json 文件部分内容如下，如果类别有层级关系，则会嵌套在 “children”： { "id": "fall11", "name": "ImageNet 2 阅读全文

posted @ 2025-05-22 21:11 片刻的自由阅读(17) 评论(0) 推荐(0)

使用vscode debug远程项目（以vLLM为例）

摘要：本机上需要准备的事项安装 vscode；下载远程连接插件：Remote - SSH，汉化插件：Chinese (Simplified) (简体中文) Language Pack for Visual Studio Code 配置文件中写入远程服务器相关信息点击右侧靠边栏“远程资源管理器” 点击“ 阅读全文

posted @ 2025-05-22 12:01 片刻的自由阅读(748) 评论(0) 推荐(0)

2025年4月26日

长尾数据集Places365-LT, ImageNet-LT构建

摘要：除了CIFAR系列，长尾图像分类用的最多的就是这三个数据集：Place365、iNaturalist2018、ImageNet（2012）分别给出需要下载的 item 以及下载地址： Place365: Small images (256 * 256) with easy directory st 阅读全文

posted @ 2025-04-26 12:09 片刻的自由阅读(270) 评论(0) 推荐(0)

2025年4月20日

cpp笔试常见的算法

摘要： KMP算法一个人能走的多远不在于他在顺境时能走的多快，而在于他在逆境时多久能找到曾经的自己！ #include <iostream> #include <vector> using namespace std; vector<int> get_next(string p) { int i = 1, 阅读全文

posted @ 2025-04-20 15:15 片刻的自由阅读(13) 评论(0) 推荐(0)

2025年3月30日

tensorRT安装

摘要： TensorRT （Tensor Runtime）是一款用于高性能深度学习推理的 SDK。它旨在与 TensorFlow、PyTorch 和 MXNet 等训练框架互补工作。它专注于在 NVIDIA 硬件上快速高效地运行已训练好的网络。 TensorRT 包含一个深度学习推理优化器和运行时，可为深度阅读全文

posted @ 2025-03-30 20:01 片刻的自由阅读(236) 评论(0) 推荐(0)

2025年2月28日

大模型常见文件格式safetensors vs. gguf

摘要： safetensors Header: 文件的元数据（大小、版本） Meta data: 列表，每个元素表示文件里存的张量的类型、形状、偏移量 Tensor data: 列表元素对应的张量数据 gguf gguf不依赖外部的配置文件，它可以把配置文件、词表、tokenizer、template等存入阅读全文

posted @ 2025-02-28 13:40 片刻的自由阅读(1347) 评论(0) 推荐(0)