会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
博客园
首页
新随笔
联系
订阅
管理
[置顶]
导航贴
摘要: 指令查询 开发环境 docker json schema prompt guide 帮助文档 各种目录 中国计算机学会推荐国际学术会议和期刊目录(2022) SCI等评级查询 Python库 网站 介绍 Vega-Altair 绘图库 PyTorch 深度学习框架 前端 网站 介绍 Element-
阅读全文
posted @ 2024-06-14 11:59 片刻的自由
阅读(103)
评论(0)
推荐(1)
2026年1月10日
[斯坦福2025春季新课CS336:从头开始构建大模型]自学笔记(15-17)
摘要: 详解SFT、RLHF & 详解大模型RL算法 & 详解GRPO SFT 模型输出幻觉造成的损失较小 SFT难以做到的事: 让模型拒绝回答:避免输出幻觉 SFT时,少量的数据都能极大地提高模型的表现,包括让模型输出更少的harmful内容 Pre-train 和 SFT 的界限变得模糊,都是预测序列,
阅读全文
posted @ 2026-01-10 12:00 片刻的自由
阅读(42)
评论(0)
推荐(0)
[斯坦福2025春季新课CS336:从头开始构建大模型]自学笔记(12-14)
摘要: 模型评估详解 Perplexity perplexity 表示模型是否对一部分数据足够关注 使用perplexing更容易你和scaling law的曲线 困惑度任务:完形填空(单词/句子) Benchmark task:考验模型对输入的理解 Massive Multitask Language U
阅读全文
posted @ 2026-01-10 11:57 片刻的自由
阅读(48)
评论(0)
推荐(0)
[斯坦福2025春季新课CS336:从头开始构建大模型]自学笔记(9-11)
摘要: 详解Scaling laws 缩放定律研究的关系包括:数据与表现;数据与模型大小;超参数与表现 缩放定律是为了获取数据、模型超参数与表现间的关系,尽量避免大规模实验 Q:实际中,我们数据有限,重复的数据是如何影响缩放的? 可以依据定律,决定训练的epoch 考虑到重复的数据价值较少。数据选择更适合缩
阅读全文
posted @ 2026-01-10 11:51 片刻的自由
阅读(70)
评论(0)
推荐(0)
[斯坦福2025春季新课CS336:从头开始构建大模型]自学笔记(5-8)
摘要: GPU原理与分布式训练基础 & 内核优化与Triton框架应用 Triton 在triton编程中,通常以SM为原子单位进行编程,SM内部有多个SP(streaming processor),一个SP会并行处理大量线程 粒度大到小:BLock -> Warp -> Thread Block由若干Th
阅读全文
posted @ 2026-01-10 11:44 片刻的自由
阅读(26)
评论(0)
推荐(0)
[斯坦福2025春季新课CS336:从头开始构建大模型]自学笔记(1-4)
摘要: 大模型概述与Tokenization & 利用Pytorch搭建大模型 Tokenizer BPE (byte pair encode) 从字符级别开始,逐步合并高频的字符对。 最终生成一个既能表示常见单词,又能拆解未知词的子词词汇表 。 可以有效控制词汇表大小,同时避免“未登录词”问题(OOV,
阅读全文
posted @ 2026-01-10 11:32 片刻的自由
阅读(75)
评论(0)
推荐(0)
2025年10月26日
[ICML2023]CLIPood Generalizing CLIP to Out-of-Distributions
摘要: Background OOD泛化任务(Out-of-Distribution (OOD) Generalization)包含两类子任务: 域偏移(domain shift):指训练集和测试集分布不同,例如训练集是写实的,测试集是素描。这类问题的解决方法包括,主要是集中在训练阶段的源域上。例如: 让不
阅读全文
posted @ 2025-10-26 20:06 片刻的自由
阅读(21)
评论(0)
推荐(0)
2025年8月26日
记录几个学习cuda编程的例子
摘要: 向量加和: #include <iostream> __global__ void vectorAdd(int n, const float* a, const float* b, float* c) { int i = blockDim.x * blockIdx.x + threadIdx.x;
阅读全文
posted @ 2025-08-26 22:02 片刻的自由
阅读(74)
评论(0)
推荐(0)
2025年6月5日
大模型请求参数中,不同penalty的作用和使用场景
摘要: presence_penalty: 对于1个token,如果它出现在生成的文本中,则施加惩罚 \[\hat{\rm logits}_i={\rm logits}_i - {\rm presence\_penalty} * \mathbb{I}({\rm frequency}_i>0) \] 鼓励模型
阅读全文
posted @ 2025-06-05 22:05 片刻的自由
阅读(142)
评论(0)
推荐(0)
2025年5月25日
[ICCV2023]Inducing Neural Collapse to a Fixed Hierarchy-Aware Frame for Reducing Mistake Severity
摘要: 这篇文章基于神经坍缩(Neural Collapse)现象,提出将样本的特征诱导到考虑类别层次的Simplex ETF(Equivalent Tight Frame)。首先,通过类别层次距离构建类别间的相似度。基于相似度,通过特征值分解构造固定的分类器权重向量。同时,增加隐藏层鼓励模型特征与对应类别
阅读全文
posted @ 2025-05-25 22:34 片刻的自由
阅读(132)
评论(0)
推荐(0)
2025年5月22日
ImageNet层次标签构建
摘要: [link] 提供了标签间的层次信息,保存在 data.json文件中,可在倒数第二个单元格点击“Download JSON”获得 data.json 文件部分内容如下,如果类别有层级关系,则会嵌套在 “children”: { "id": "fall11", "name": "ImageNet 2
阅读全文
posted @ 2025-05-22 21:11 片刻的自由
阅读(17)
评论(0)
推荐(0)
使用vscode debug远程项目(以vLLM为例)
摘要: 本机上需要准备的事项 安装 vscode;下载远程连接插件:Remote - SSH,汉化插件:Chinese (Simplified) (简体中文) Language Pack for Visual Studio Code 配置文件中写入远程服务器相关信息 点击右侧靠边栏“远程资源管理器” 点击“
阅读全文
posted @ 2025-05-22 12:01 片刻的自由
阅读(748)
评论(0)
推荐(0)
2025年4月26日
长尾数据集Places365-LT, ImageNet-LT构建
摘要: 除了CIFAR系列,长尾图像分类用的最多的就是这三个数据集:Place365、iNaturalist2018、ImageNet(2012) 分别给出需要下载的 item 以及下载地址: Place365: Small images (256 * 256) with easy directory st
阅读全文
posted @ 2025-04-26 12:09 片刻的自由
阅读(270)
评论(0)
推荐(0)
2025年4月20日
cpp笔试常见的算法
摘要: KMP算法 一个人能走的多远不在于他在顺境时能走的多快,而在于他在逆境时多久能找到曾经的自己! #include <iostream> #include <vector> using namespace std; vector<int> get_next(string p) { int i = 1,
阅读全文
posted @ 2025-04-20 15:15 片刻的自由
阅读(13)
评论(0)
推荐(0)
2025年3月30日
tensorRT安装
摘要: TensorRT (Tensor Runtime)是一款用于高性能深度学习推理的 SDK。它旨在与 TensorFlow、PyTorch 和 MXNet 等训练框架互补工作。它专注于在 NVIDIA 硬件上快速高效地运行已训练好的网络。 TensorRT 包含一个深度学习推理优化器和运行时,可为深度
阅读全文
posted @ 2025-03-30 20:01 片刻的自由
阅读(236)
评论(0)
推荐(0)
2025年2月28日
大模型常见文件格式safetensors vs. gguf
摘要: safetensors Header: 文件的元数据(大小、版本) Meta data: 列表,每个元素表示文件里存的张量的类型、形状、偏移量 Tensor data: 列表元素对应的张量数据 gguf gguf不依赖外部的配置文件,它可以把配置文件、词表、tokenizer、template等存入
阅读全文
posted @ 2025-02-28 13:40 片刻的自由
阅读(1347)
评论(0)
推荐(0)
下一页