CUDA编程 - 随笔分类 - 无人知晓LLH

cublas fp16

摘要：编译选项： nvcc 4.cpp -o test_gemm -lcudart -lcuda -lcublas -std=c++11 #include <sys/time.h> #include <cuda_profiler_api.h> #include <cublas_v2.h> #include 阅读全文

posted @ 2021-11-10 20:52 无人知晓LLH 阅读(224) 评论(0) 推荐(0)

thrust

摘要：统计一个数组中重复的数字的个数：https://www.codenong.com/7573900/ 阅读全文

posted @ 2021-10-09 19:00 无人知晓LLH 阅读(75) 评论(0) 推荐(0)

thrust

摘要：1. Cuda中的thrust库的使用 cuda的thrust的官方文档地址：https://docs.nvidia.com/cuda/thrust/ Thrust 是一个类似STL的 CUDA C++ 模板库 Thrust是并行算法和数据结构的基于GPU CUDA的C++库。Thrust主要通过管阅读全文

posted @ 2021-10-08 16:51 无人知晓LLH 阅读(1892) 评论(0) 推荐(0)

Tesla 架构

摘要：阅读全文

posted @ 2021-09-03 14:39 无人知晓LLH

cuda

摘要：阅读全文

posted @ 2021-03-25 10:59 无人知晓LLH 阅读(62) 评论(0) 推荐(0)

cuda 并行归约

摘要：一、文献阅读 1.《基于OpenMP的分子动力学并行算法的性能分析与优化》时间：201201[ll1] 分析Critical方法的并行性能，提出优化的三角形方法，所提方法中每个线程所计算的粒子数固定，且粒子数目呈阶梯状上升，使得各线程能够错时到达临界区，从而使程序在临界区的闲置时间比Critica 阅读全文

posted @ 2021-03-11 12:39 无人知晓LLH 阅读(539) 评论(0) 推荐(0)

CUDA实战3

摘要：1.两个一维数组相加，求和 1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <time.h> 4 #include "cuda_runtime.h" 5 #include "device_launch_parameters.h" 6 voi 阅读全文

posted @ 2020-04-11 22:03 无人知晓LLH 阅读(357) 评论(0) 推荐(0)

CUDA实战2

摘要：1.clock()函数是C/C++中的计时函数，相关的数据类型是clock_t，使用clock函数可以计算运行某一段程序所需的时间，如下所示程序计算从10000000逐渐减一直到0所需的时间。注：每次运行所需时间可能会不一样 1 #include "cuda_runtime.h" 2 #inclu 阅读全文

posted @ 2020-04-11 09:50 无人知晓LLH 阅读(266) 评论(0) 推荐(0)

CUDA实战

摘要：1.第一个程序，输出hello world，1个Block块中含有5个线程 1 #include <stdio.h> 2 #include "cuda_runtime.h" 3 4 __global__ void hello(void) 5 { 6 printf("hello world from 阅读全文

posted @ 2020-04-10 13:47 无人知晓LLH 阅读(197) 评论(0) 推荐(0)

CUDA学习笔记二

摘要：一、线性线性的组织形式对程序的性能是非常重要的。 gridDim.x 线程网格X维度上线程块 gridDim.y 线程网格Y维度上线程块的数量 blockDim.x 一个线程块X维度上的线程数量 blockDim.y 一个线程块Y维度上的线程数量 blockIdx.x 线程网格X维度上的线程块索引阅读全文

posted @ 2020-02-21 12:45 无人知晓LLH 阅读(436) 评论(0) 推荐(0)

CUDA学习笔记一

摘要：一、CUDA简介 CUDA是并行计算的平台和类C编程模型，可以实现并行算法。电脑要配备NVIDIA GPU，就可以在许多设备上运行你的并行程序。二、CUAD编程 CUDA编程允许程序执行在异构系统上，即CPU和GPU，并由PCL-Express总线区分开。 Host：CPU and itsmemo 阅读全文

posted @ 2020-02-20 09:49 无人知晓LLH 阅读(938) 评论(0) 推荐(0)

CUDA入门

摘要：一、CUDA来源 2006年，NVIDIA公司发布了CUDA，CUDA是建立在NVIDIA的CPUs上的一个通用并行计算平台和编程模型，基于CUDA编程可以利用GPUs的并行计算引擎来更加高效的解决比较复杂的计算难题。当前，GPU最成功的一个应用就是深度学习领域，基于GPU 的并行计算已经成为训练深阅读全文

posted @ 2020-02-19 09:40 无人知晓LLH 阅读(1284) 评论(0) 推荐(0)

无人知晓

随笔分类 - CUDA编程

导航

公告