摘要:
本文介绍 CudaSharp 项目在 CUDA SIFT 算法上的两项核心优化:**GA102 芯片(RTX 3080/3080 Ti)端到端 GPU 加速**与 **SafeMem 内存/显存安全体系**。通过将特征检测、方向分配、描述子生成等关键瓶颈环节全面 GPU 化,配合共享内存 tile 优化与显存池管理,大图像处理速度提升 **1.62x**;同时引入自定义 SafeMem 库,系统性解决内存泄漏、越界访问、Use-After-Free 等安全问题,将代码健壮性提升至工业级标准。 阅读全文
本文介绍 CudaSharp 项目在 CUDA SIFT 算法上的两项核心优化:**GA102 芯片(RTX 3080/3080 Ti)端到端 GPU 加速**与 **SafeMem 内存/显存安全体系**。通过将特征检测、方向分配、描述子生成等关键瓶颈环节全面 GPU 化,配合共享内存 tile 优化与显存池管理,大图像处理速度提升 **1.62x**;同时引入自定义 SafeMem 库,系统性解决内存泄漏、越界访问、Use-After-Free 等安全问题,将代码健壮性提升至工业级标准。 阅读全文
posted @ 2026-04-18 21:23
qsBye
阅读(8)
评论(0)
推荐(0)
摘要:
使用CUDA在GPU上加速SIFT特征提取与匹配算法, 并封装为CSharp库, 支持图像相似度评分和模板缓存. 阅读全文
使用CUDA在GPU上加速SIFT特征提取与匹配算法, 并封装为CSharp库, 支持图像相似度评分和模板缓存. 阅读全文
posted @ 2026-04-18 13:09
qsBye
阅读(15)
评论(0)
推荐(0)
摘要:
在Windows上配置kimi-cli通过WriteFile和ReadFile间接调用Shell, 解决`Tool Runtime Error`问题. 阅读全文
在Windows上配置kimi-cli通过WriteFile和ReadFile间接调用Shell, 解决`Tool Runtime Error`问题. 阅读全文
posted @ 2026-04-18 10:52
qsBye
阅读(10)
评论(0)
推荐(0)

使用CUDA在GPU上完成高像素图片动态阈值二值化, 并封装为CSharp库.
将OpenEuler系统上NVIDIA Tesla A100 SXM4-40GB的驱动从460.106.00(CUDA 11.2)更新至595.58.03(CUDA 13.2),实现大模型推理环境的现代化升级。更新后支持最新CUDA生态,为运行Qwen3-30B-A3B等新一代大模型提供硬件基础。
不走寻常路, 在安卓手机通过java虚拟机PojavLauncher运行基于java8的lua解释器.Running a Java 8-based Lua interpreter on Android phones through the Java virtual machine PojavLauncher.
使用cli工具从文件夹导入模型及导出本机ollama模型到文件夹.
浙公网安备 33010602011771号