随笔档案「2021年8月」 - DECHIN

Python实现GPU加速的基本操作

摘要：本文针对于Python中使用Numba的GPU加速程序的一些基本概念和实现的方法，比如GPU中的线程和模块的概念，以及给出了一个矢量加法的代码案例，进一步说明了GPU加速的效果。需要注意的是，由于Python中的Numba实现是一种即时编译的技术，因此第一次运算时的时间会明显较长，所以我们一般说GPU加速是指从第二步开始的运行时间。对于一些工业和学界常见的场景，比如分子动力学模拟中的系统演化，或者是深度学习与量子计算中的参数优化，都是相同维度参数多步运算的一个过程，非常适合使用即时编译的技术，配合以GPU高度并行化的加速效果，能够在实际工业和学术界的各种场景下发挥巨大的作用。阅读全文

posted @ 2021-08-31 16:09 DECHIN 阅读(7896) 评论(7) 推荐(0)

Python的GPU编程实例——近邻表计算

摘要：对于Pythoner而言，苦其性能已久。如果能够用一种非常Pythonic的方法来实现GPU的加速效果，对于Pythoner而言无疑是巨大的好消息，Numba就为我们提供了这样的一个基础功能。本文通过一个近邻表计算的案例，给出了适用于GPU加速的计算场景。这种计算场景可并行化的程度较高，而且函数会被多次用到（在分子动力学模拟的过程中，每一个step都会调用到这个函数），因此这是一种最典型的、最适用于GPU加速场景的案例。阅读全文

posted @ 2021-08-31 09:49 DECHIN 阅读(2274) 评论(0) 推荐(2)

超过Numpy的速度有多难？试试Numba的GPU加速

摘要：Numpy这个库在Python编程中非常的常用，不仅在性能上补足了Python语言的一些固有缺陷，还具有无与伦比的强大生态。但是即使都是使用Python，Numpy也未必就达到了性能的巅峰，对于我们自己日常中使用到的一些计算的场景，针对性的使用CUDA的功能来进行GPU的优化，是可以达到比Numpy更高的性能的。阅读全文

posted @ 2021-08-24 17:40 DECHIN 阅读(3711) 评论(2) 推荐(0)

使用autopep8自动规范化python3代码

摘要：本文主要通过介绍两个python中常用的编码规范格式化工具：autopep8和black来讲解python编程中一些快速处理编程规范问题的方法，同时也说明了这些软件的局限性。编程规范也是人为制定的，事实上在实际项目中，也不是所有的编程规范都需要满足，这就需要项目的组织者或者领导者有自己的基本判断。结合代码规范检查工具flake8以及文章中介绍的这些代码规范格式化工具，最重要的还是要配合以人的判断和调整，才能使得项目具有更好的可读性、可维护性以及更友善的生态。阅读全文

posted @ 2021-08-23 16:04 DECHIN 阅读(1418) 评论(0) 推荐(0)

Python3实现Two-Pass算法检测区域连通性

摘要：在本文中我们主要介绍了利用Two-Pass的算法来检测区域连通性，并给出了Python3的代码实现，当然在实现的过程中因为没有使用到Union这样的数据结构，仅仅用了字典来存储标签之间的关系，因此效率和代码可读性都会低一些，单纯作为用例的演示和小规模区域划分的计算是足够用了。在该代码实现方案中，还有一点与原始算法不一致的是，本实现方案中打新的标签是读取上、上左和左三个方向的格点，但是存储标签的映射关系时，是读取了上、上左、上右和左这四个方向的格点。阅读全文

posted @ 2021-08-18 15:48 DECHIN 阅读(1538) 评论(0) 推荐(0)

Dechin的博客

研究兴趣: 分子动力学模拟、量子计算与量子算法、Python编程与深度学习

08 2021 档案

公告