摘要: 指令查询 开发环境 docker json schema prompt guide 帮助文档 各种目录 中国计算机学会推荐国际学术会议和期刊目录(2022) SCI等评级查询 Python库 网站 介绍 Vega-Altair 绘图库 PyTorch 深度学习框架 前端 网站 介绍 Element- 阅读全文
posted @ 2024-06-14 11:59 片刻的自由 阅读(95) 评论(0) 推荐(1)
摘要: 向量加和: #include <iostream> __global__ void vectorAdd(int n, const float* a, const float* b, float* c) { int i = blockDim.x * blockIdx.x + threadIdx.x; 阅读全文
posted @ 2025-08-26 22:02 片刻的自由 阅读(33) 评论(0) 推荐(0)
摘要: presence_penalty: 对于1个token,如果它出现在生成的文本中,则施加惩罚 \[\hat{\rm logits}_i={\rm logits}_i - {\rm presence\_penalty} * \mathbb{I}({\rm frequency}_i>0) \] 鼓励模型 阅读全文
posted @ 2025-06-05 22:05 片刻的自由 阅读(85) 评论(0) 推荐(0)
摘要: 这篇文章基于神经坍缩(Neural Collapse)现象,提出将样本的特征诱导到考虑类别层次的Simplex ETF(Equivalent Tight Frame)。首先,通过类别层次距离构建类别间的相似度。基于相似度,通过特征值分解构造固定的分类器权重向量。同时,增加隐藏层鼓励模型特征与对应类别 阅读全文
posted @ 2025-05-25 22:34 片刻的自由 阅读(70) 评论(0) 推荐(0)
摘要: [link] 提供了标签间的层次信息,保存在 data.json文件中,可在倒数第二个单元格点击“Download JSON”获得 data.json 文件部分内容如下,如果类别有层级关系,则会嵌套在 “children”: { "id": "fall11", "name": "ImageNet 2 阅读全文
posted @ 2025-05-22 21:11 片刻的自由 阅读(15) 评论(0) 推荐(0)
摘要: 本机上需要准备的事项 安装 vscode;下载远程连接插件:Remote - SSH,汉化插件:Chinese (Simplified) (简体中文) Language Pack for Visual Studio Code 配置文件中写入远程服务器相关信息 点击右侧靠边栏“远程资源管理器” 点击“ 阅读全文
posted @ 2025-05-22 12:01 片刻的自由 阅读(312) 评论(0) 推荐(0)
摘要: 除了CIFAR系列,长尾图像分类用的最多的就是这三个数据集:Place365、iNaturalist2018、ImageNet(2012) 分别给出需要下载的 item 以及下载地址: Place365: Small images (256 * 256) with easy directory st 阅读全文
posted @ 2025-04-26 12:09 片刻的自由 阅读(140) 评论(0) 推荐(0)
摘要: Floyd算法 #include <limits.h> #include <algorithm> #include <iostream> #include <vector> using namespace std; const int finite = 1000000; void floyd(vec 阅读全文
posted @ 2025-04-20 15:15 片刻的自由 阅读(9) 评论(0) 推荐(0)
摘要: TensorRT (Tensor Runtime)是一款用于高性能深度学习推理的 SDK。它旨在与 TensorFlow、PyTorch 和 MXNet 等训练框架互补工作。它专注于在 NVIDIA 硬件上快速高效地运行已训练好的网络。 TensorRT 包含一个深度学习推理优化器和运行时,可为深度 阅读全文
posted @ 2025-03-30 20:01 片刻的自由 阅读(167) 评论(0) 推荐(0)
摘要: safetensors Header: 文件的元数据(大小、版本) Meta data: 列表,每个元素表示文件里存的张量的类型、形状、偏移量 Tensor data: 列表元素对应的张量数据 gguf gguf不依赖外部的配置文件,它可以把配置文件、词表、tokenizer、template等存入 阅读全文
posted @ 2025-02-28 13:40 片刻的自由 阅读(1245) 评论(0) 推荐(0)
摘要: 这篇论文提出使用超网络生成专家模型的参数,实现可控的、能根据用户偏好预测的专家模型。 Related works 长尾学习(long-tailed learning)的方法包括重采样、设计损失函数,旨在提高尾部类的表现。然而,这类方法往往假设测试集是类别平衡的,在训练时的操作也是希望学到一个均衡预测 阅读全文
posted @ 2025-02-28 08:47 片刻的自由 阅读(73) 评论(0) 推荐(0)
摘要: Knowledge-Based Systems: [期刊首页] [作者提交系统] 提交必须要的文件 Author Agreement 没有模板,参考[link]写的 Author Agreement We have seen and approved the final version of the 阅读全文
posted @ 2025-02-23 22:03 片刻的自由 阅读(574) 评论(0) 推荐(0)
摘要: 有时候服务器只能访问大陆的网站,因此下载 cuda(gpu) 版的 pytorch非常慢。简单的方法是更换镜像源,网上的方法比较乱,实际上换源后直接安装即可。这里使用清华源。 设置全局 pip 源: pip config set global.index-url https://mirrors.tu 阅读全文
posted @ 2025-02-14 09:57 片刻的自由 阅读(3182) 评论(0) 推荐(0)
摘要: Background Agent(智能体)指某一个实体,能根据外部的环境,自主做出决策和行动。一个简单的agent示例是一个温度控制器,它能根据环境的温度,自动调节加热器的开关。 \[\begin{aligned}(\text{temperature}>70^{\circ})\wedge(\text 阅读全文
posted @ 2025-02-03 14:43 片刻的自由 阅读(119) 评论(0) 推荐(0)
摘要: 前言 模型中常见的可训练层包括卷积层和线性层,这里将给出计算公式并在pytorch下进行验证。 计算模型的参数: import torch.nn as nn def cal_params(model: nn.Module): num_learnable_params = sum(p.numel() 阅读全文
posted @ 2024-12-18 17:10 片刻的自由 阅读(1729) 评论(0) 推荐(0)
摘要: 这篇文章基于样本选择的噪声标签学习(Learning with Noisy labels)方法,通过引入CLIP帮助过滤噪声样本。 Introduction 噪声标签的方法包括: 开发鲁棒的损失函数 使用标签噪声转移矩阵对噪声标签进行建模 然而这些方法在处理高噪声比和复杂的噪声模式(两个图片很相近但 阅读全文
posted @ 2024-12-17 11:42 片刻的自由 阅读(172) 评论(0) 推荐(0)