摘要:
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。 dump方法 pickle.dump(obj, file, [,pro 阅读全文
posted @ 2020-07-07 11:18
Neo_KH
阅读(187)
评论(0)
推荐(0)
摘要:
在看PIE的训练代码,发现里面用到了三个callbacks函数: from keras.callbacks import EarlyStopping from keras.callbacks import ModelCheckpoint from keras.callbacks import Red 阅读全文
posted @ 2020-07-07 11:17
Neo_KH
阅读(395)
评论(0)
推荐(0)
摘要:
写在前面 本文转载自吴坎的博客。 简介 显卡上的规约操作是一个经典优化案例。在网上能找到的大部分实现中,性能比较优秀的是使用 Shared Memory 并进行访存优化的树形规约。 近期正好在做这方面的一些优化,同时了解到从 CUDA 9.0 开始,CUDA 引入了更加灵活的 Warp 操作原语,这 阅读全文
posted @ 2020-07-07 11:15
Neo_KH
阅读(2167)
评论(0)
推荐(1)
摘要:
写在前面 本文转载自吴坎的博客。 实验简介 使用下面一种或多种优化方法完成 CUDA 的矩阵向量乘法$A\times b=C$,其中 A 是$2^{14}\times 2^{14}$的方阵,$b$为$2^{14}$维向量。假设矩阵$A$的元素为$a_{i,j}=i-0.1\times j+1$,向量 阅读全文
posted @ 2020-07-07 11:14
Neo_KH
阅读(1504)
评论(0)
推荐(0)
摘要:
写在前面 本文转载自吴坎的博客。 实验简介 使用下面一种或多种优化方法完成 CUDA 的矩阵乘法$A\times B=C$ 使用 global memory 合并访存 采用分块乘法,使用 shared memory 请找出最佳的执行配置参数:grid 和 blocks 其中 A,B,C 是$2^{1 阅读全文
posted @ 2020-07-07 11:13
Neo_KH
阅读(1423)
评论(0)
推荐(0)
摘要:
MPI_INT, 0, MPI_COMM_WORLD); if (!comRank) { for (int i = disp.data[0] = 0; i < comSize - 1; ++i) disp.data[i + 1] = disp.data[i] + count.data[i]; c_c 阅读全文
posted @ 2020-07-07 11:11
Neo_KH
阅读(234)
评论(0)
推荐(0)
摘要:
写在前面 本文转载自吴坎的博客。 类型 数据结构 图论 数论 组合数学 线性代数 离散数学 数学分析 计算几何 高精度 C++语言相关 阅读全文
posted @ 2020-07-07 11:10
Neo_KH
阅读(199)
评论(0)
推荐(0)

浙公网安备 33010602011771号