Neo_KH

2020年7月7日

摘要： python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去，永久存储；通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象。 dump方法 pickle.dump(obj, file, [,pro 阅读全文

posted @ 2020-07-07 11:18 Neo_KH 阅读(187) 评论(0) 推荐(0)

Keras之callbacks

摘要：在看PIE的训练代码，发现里面用到了三个callbacks函数： from keras.callbacks import EarlyStopping from keras.callbacks import ModelCheckpoint from keras.callbacks import Red 阅读全文

posted @ 2020-07-07 11:17 Neo_KH 阅读(395) 评论(0) 推荐(0)

转载-用Shuffle加速CUDA上的Reduce操作

摘要：写在前面本文转载自吴坎的博客。简介显卡上的规约操作是一个经典优化案例。在网上能找到的大部分实现中，性能比较优秀的是使用 Shared Memory 并进行访存优化的树形规约。近期正好在做这方面的一些优化，同时了解到从 CUDA 9.0 开始，CUDA 引入了更加灵活的 Warp 操作原语，这阅读全文

posted @ 2020-07-07 11:15 Neo_KH 阅读(2167) 评论(0) 推荐(1)

转载-CUDA矩阵向量乘的多种优化

摘要：写在前面本文转载自吴坎的博客。实验简介使用下面一种或多种优化方法完成 CUDA 的矩阵向量乘法$A\times b=C$,其中 A 是$2^{14}\times 2^{14}$的方阵，$b$为$2^{14}$维向量。假设矩阵$A$的元素为$a_{i,j}=i-0.1\times j+1$，向量阅读全文

posted @ 2020-07-07 11:14 Neo_KH 阅读(1504) 评论(0) 推荐(0)

转载-CUDA矩阵乘法的优化

摘要：写在前面本文转载自吴坎的博客。实验简介使用下面一种或多种优化方法完成 CUDA 的矩阵乘法$A\times B=C$ 使用 global memory 合并访存采用分块乘法，使用 shared memory 请找出最佳的执行配置参数：grid 和 blocks 其中 A，B，C 是$2^{1 阅读全文

posted @ 2020-07-07 11:13 Neo_KH 阅读(1423) 评论(0) 推荐(0)

转载-稀疏矩阵乘法

摘要： MPI_INT, 0, MPI_COMM_WORLD); if (!comRank) { for (int i = disp.data[0] = 0; i < comSize - 1; ++i) disp.data[i + 1] = disp.data[i] + count.data[i]; c_c 阅读全文

posted @ 2020-07-07 11:11 Neo_KH 阅读(234) 评论(0) 推荐(0)

转载-算法竞赛模板

摘要：写在前面本文转载自吴坎的博客。类型数据结构图论数论组合数学线性代数离散数学数学分析计算几何高精度 C++语言相关阅读全文

posted @ 2020-07-07 11:10 Neo_KH 阅读(199) 评论(0) 推荐(0)

2020年7月6日

Docker常用操作

摘要：增、改、删、查查看服务器上存在的镜像 docker images 查看存在的容器 docker ps #查看运行的容器 docker ps -a #查看所有的容器，包括已经退出的容器从存在的镜像创建容器运行~目录下的./deploy_container_with_gpu.sh 注意： sour 阅读全文

posted @ 2020-07-06 10:56 Neo_KH 阅读(152) 评论(0) 推荐(0)

让生如夏花之绚烂，死如秋叶之静美！

公告