Python调用C加速计算

python遇到计算性能瓶颈尽量使用Numpy，因为Numpy会调用C的并行计算库，如果numpy不能实现你的需求，就只好自己写C代码了。

用C实现数组的按位相乘（当然这个功能用numpy就可以实现，这里只是个示例）：

#include<stdlib.h>
#include<omp.h>

void dot(const float *arr, const float *brr, float *crr, int n){
    int i;
    #pragma omp parallel for num_threads(8)//显式指定线程数
    for (i=0;i<n;i++){//如果n比较小（比如数百），则用openmp的效果不明显
        crr[i]=arr[i]*brr[i];
    }
    return;
}

值得一提的是，对于计算密集型任务，即使不用OpenMP，C语言的速度也比Python快一个数量级。

生成动态库：

//-fPIC：是指生成的动态库与位置无关

//-fopenmp：启用openmp多线程

gcc -O -c -fPIC -fopenmp -o dot.o dot.c

gcc -shared -fopenmp -o libdot.so dot.o

用python调用C动态库:

# coding:utf-8

from ctypes import *
import numpy as np
import numpy.ctypeslib as npct

lib = cdll.LoadLibrary("./libdot.so")  # 注意是相对于执行python命令时的路径

'''申明dot函数的传入参数类型:ndpointer为numpy.ctypeslib扩展库中提供的函数，可将numpy数组转为指针形式被C函数识别, 其中ndim表示数组维数。
'''
lib.dot.argtypes = [
    npct.ndpointer(dtype=np.float32, ndim=1),
    npct.ndpointer(dtype=np.float32, ndim=1),
    npct.ndpointer(dtype=np.float32, ndim=1),
    c_int
]


def dot(arr, brr):
    crr = np.zeros(shape=arr.shape, dtype=np.float32)
    lib.dot(arr, brr, crr, len(arr))
    return crr


arr = np.array([1, 4, 8], dtype=np.float32)
brr = np.array([3, 5, 1], dtype=np.float32)
print dot(arr, brr)  # [ 3. 20.  8.]

posted @ 2019-08-18 15:11 张朝阳讲go语言阅读(1399) 评论(0) 收藏举报

刷新页面返回顶部

张朝阳讲go语言

Technologies come and technologies go, but insight is forever.

Python调用C加速计算

公告