1 2 3 4 5 ··· 30 下一页
摘要: 折腾笔记[50]-cuda的性能优化及显存访问安全措施 本文介绍 CudaSharp 项目在 CUDA SIFT 算法上的两项核心优化:**GA102 芯片(RTX 3080/3080 Ti)端到端 GPU 加速**与 **SafeMem 内存/显存安全体系**。通过将特征检测、方向分配、描述子生成等关键瓶颈环节全面 GPU 化,配合共享内存 tile 优化与显存池管理,大图像处理速度提升 **1.62x**;同时引入自定义 SafeMem 库,系统性解决内存泄漏、越界访问、Use-After-Free 等安全问题,将代码健壮性提升至工业级标准。 阅读全文
posted @ 2026-04-18 21:23 qsBye 阅读(8) 评论(0) 推荐(0)
摘要: 折腾笔记[49]-cuda的SIFT特征匹配 使用CUDA在GPU上加速SIFT特征提取与匹配算法, 并封装为CSharp库, 支持图像相似度评分和模板缓存. 阅读全文
posted @ 2026-04-18 13:09 qsBye 阅读(15) 评论(0) 推荐(0)
摘要: 折腾笔记[48]-通过WriteFile和ReadFile间接调用Shell 在Windows上配置kimi-cli通过WriteFile和ReadFile间接调用Shell, 解决`Tool Runtime Error`问题. 阅读全文
posted @ 2026-04-18 10:52 qsBye 阅读(10) 评论(0) 推荐(0)
摘要: 折腾笔记[47]-cuda的图像动态阈值二值化 使用CUDA在GPU上完成高像素图片动态阈值二值化, 并封装为CSharp库. 阅读全文
posted @ 2026-04-12 14:48 qsBye 阅读(7) 评论(0) 推荐(0)
摘要: 在docker中部署UMI-OCR服务, 生成二维码. 阅读全文
posted @ 2026-04-12 10:38 qsBye 阅读(47) 评论(0) 推荐(0)
摘要: Linux运维笔记[16]-更新OpenEuler的cuda驱动 将OpenEuler系统上NVIDIA Tesla A100 SXM4-40GB的驱动从460.106.00(CUDA 11.2)更新至595.58.03(CUDA 13.2),实现大模型推理环境的现代化升级。更新后支持最新CUDA生态,为运行Qwen3-30B-A3B等新一代大模型提供硬件基础。 阅读全文
posted @ 2026-04-04 10:27 qsBye 阅读(38) 评论(0) 推荐(0)
摘要: 折腾笔记[46]-在安卓手机运行基于java8的lua解释器 不走寻常路, 在安卓手机通过java虚拟机PojavLauncher运行基于java8的lua解释器.Running a Java 8-based Lua interpreter on Android phones through the Java virtual machine PojavLauncher. 阅读全文
posted @ 2026-03-15 17:20 qsBye 阅读(24) 评论(0) 推荐(0)
摘要: 折腾笔记[45]-导入及导出ollama模型 使用cli工具从文件夹导入模型及导出本机ollama模型到文件夹. 阅读全文
posted @ 2026-03-08 19:21 qsBye 阅读(125) 评论(0) 推荐(0)
摘要: 使用轻量化的continuwuity部署matrix内部聊天服务器(homeserver). 阅读全文
posted @ 2026-03-08 15:21 qsBye 阅读(212) 评论(0) 推荐(0)
摘要: 基于csharp的时钟. 阅读全文
posted @ 2026-02-15 14:03 qsBye 阅读(6) 评论(0) 推荐(0)
1 2 3 4 5 ··· 30 下一页