摘要:
百度AI studio克隆失败解决办法 目前还没办法在其他地方查到问题的解决办法,在此记录一下 具体问题描述 在飞桨AI studio克隆paddle的submodule时,会遇到各种网络导致的问题(开关代理都没有用) 具体的报错包括: 失败的尝试 把github链接换成gitee的,但是一些库在g 阅读全文
摘要:
Go入门笔记 Go是编译型语言: Go 代码通过 go build 或 go run 等命令来编译成二进制文件。尽管 Go 允许使用 go run 直接执行代码,但背后其实是先将代码编译成二进制文件再执行,而非逐行解释执行。 Go语言常用的命名规范 在 Go 中,导出的(exported)函数名应该 阅读全文
摘要:
2024全国大学生计算机系统能力大赛全国总决赛-OS功能挑战赛道答辩心得、教训 虽然标题中写的是"心得、教训",但因为本次比赛表现较差,主要还是记录一下教训。 场外因素的影响 因为平时比较喜欢熬夜,在去杭州的前一天晚上睡得很晚,当天又因为初到杭州十分亢奋,在旅途上全程没有补觉。导致第二天白天(答辩前 阅读全文
摘要:
麒麟开发日志 前期环境配置 sysbench安装过程中遇到的问题、解决办法; 如何利用sysbench对mySQL进行压力测试:参见对话24/6/13 Kylin docker的安装和配置 solution在最后一步。 1.按照gpt给出的提示尝试安装依赖 sudo dnf -y install d 阅读全文
摘要:
额外信息 Bison中百分号的作用:Bison中百分号的作用 - Gold_stein - 博客园 Lv0.环境配置 因为win11默认开启的VBS会导致在游戏等高负载场景显卡占用异常,但是win11又已经关闭了单独关闭vbs同时保留hyperv的通道,所以只能选择一劳永逸地将hyperv关闭。这样 阅读全文
摘要:
wsl2 Ubuntu配置静态Ip 内容 在 Ubuntu 中设置静态 IP 地址主要通过 netplan 工具(适用于 17.10 及更高版本)实现。以下是详细步骤: 一、查看当前网络接口信息 ip addr show # 或 nmcli device status 找到要配置的接口名称(如 en 阅读全文
摘要:
C++定义高纬度vector 内容 在处理算法题时,定义高维数组确实可能因语法冗长而影响效率。以下是针对不同编程语言的简洁解决方案: C++ 解决方案 1. 模板元编程生成多维 vector 通过递归模板自动推导嵌套类型,实现高维数组的声明: template <typename T, int N> 阅读全文
摘要:
层和算子 内容 在深度学习框架中,Layer(层) 和 算子(Operator) 是构建神经网络的两个核心概念,它们的关系可以用 抽象层级 和 功能组合 来概括。以下是详细的解析: 一、定义与核心区别 概念 Layer(层) 算子(Operator) 抽象层级 高级抽象(面向模型设计) 低级原子操作 阅读全文
摘要:
Python处理算法题输入输出 内容 以下是 Python 处理算法题输入输出的详细指南,对比 C++ 习惯并给出高效写法: 一、输入处理核心方法 Python 处理输入通常比 C++ 更简洁,但要注意 数据类型转换 和 批量读取 优化。 1. 基础输入方法 场景描述 C++ 写法 Python 等 阅读全文
摘要:
连续非空子数组 题面 思路 正向求解的话,需要枚举所有的子数组,复杂度会来到\(O(n^3)\),完全不可行,在观察题目输入描述,\(a_i\)的取值范围非常小,故我们考虑反向求解(这也是非常经典的思路,无法直接计数,我们就计算每个答案的贡献是多少) 利用类似滑动窗口的思想,去统计\(mex(1), 阅读全文
摘要:
CUDA提高Memory throughput的方法 内容 在 CUDA 编程中,提高内存吞吐量(Memory Throughput)是优化性能的关键。以下是系统化的优化策略和示例: 1. 理解内存层次与带宽 CUDA 设备的内存层次包括: 全局内存(Global Memory):高延迟,低带宽(但 阅读全文
摘要:
cuda12+版本==WARNING== Could not deploy stock section解决办法 前置条件 如果是在wsl2当中进行使用,需要现在NVIDIA控制面板当中,允许所有用户访问性能计数器。 问题描述 在学习cuda-training-series期间,遇到了这样的问题: 使 阅读全文
摘要:
CUDA bank常见误区——宽度和容量 内容 Bank的宽度(Width)和Bank的容量(Capacity)是两个独立的概念,它们分别描述了Bank的不同特性。以下是详细解释: 1. Bank的宽度(Width) 定义:Bank的宽度指每次访问能读写的数据位数。 CUDA的实现: 每个Bank的 阅读全文
摘要:
cuDNN vs 推理框架 内容 深度学习中计算加速库与推理框架有明确的定位差异。以下从技术架构角度解析两者的区别,并列举主流推理框架及其应用场景: CUDA Deep Neural Network (cuDNN) 核心定位 属性 说明 层级 GPU加速库(底层计算原语) 主要场景 训练/推理阶段的 阅读全文
摘要:
根据给定数字生成等概率随机数 内容 要使用两个[1,7]的随机数生成[1,9]的等概率随机数,可以通过以下步骤实现: 核心思路 组合范围:两个1-7的随机数共有 (7 \times 7 = 49) 种组合。 均匀分组:将49种组合中的45种均匀分配给1-9(每组5种),剩余4种组合拒绝并重试。 拒绝 阅读全文