Python数据分析--计算函数pandasnumpy
pandas
各函数详情请查阅
| 函数 | 说明 |
|---|---|
| df.count() | 非NA观测数量 |
| df.sum(axis=0, skipna=True, level=NaN) | 求和 |
| df.add(df2, fill_value=NaN, axist=1) | 两列元素求和,df.a+df.b |
| df.cumsum(axis=0, skipna=True, level=NaN) | 累计和 |
| df.cumprod(axis=0, skipna=True, level=NaN) | 累计积 |
| df.mul(df2, fill_value=NaN, axist=1) | 两列元素相乘,df.a * df.b |
| df.sub(df2, fill_value=NaN, axist=1) | 两列元素相减,df.a - df.b |
| df.div(df2, fill_value=NaN, axist=1) | 两列元素相除,df.a / df.b |
| df.mode() | 返回众,一组数据中出现最多的数 |
| df.mean(axis=0, skipna=True, level=NaN) | 平均值 |
| df.median(axis=0, skipna=True, level=NaN) | 中位数 |
| df.mad(axis=0, skipna=True, level=NaN) | 平均绝对离差 |
| df.var(axis=0, skipna=True, level=NaN) | 方差 |
| df.cov(other, min_periods=None) | 协方差 |
| df.std(axis=0, skipna=True, level=NaN) | 标准差 |
| df.sem() | 平均值的标准误差 |
| df.skew(axis=0, skipna=True, level=NaN) | 偏度(三阶距) |
| df.kurt(axis=0, skipna=True, level=NaN) | 峰度(四阶距) |
| df.quantile() | 样本分位数(值为%) |
| df.diff(axis=0) | 一阶差分 |
| df.pct_change(axis=0) | 百分比数变化 |
| df.abs() | 绝对值 |
numpy
数学运算 各函数详情请查阅
| 函数 | 说明 |
|---|---|
| np.mod(x1,x2) | 返回除法元素的余数 |
| np.divmod | 同时返回逐元素的商和余数 |
| np.log(x) | 自然对数 |
| np.log1p(x) | 返回一个加上输入数组的自然对数,逐个元素 |
| np.log2(x) | x的基数为2的对数 |
| np.log10(x) | 以元素方式返回输入数组的基数10对数 |
| np.log(x) / np.log(4) | x的基数为4的对数,自设底 |
| np.exp(x) | 计算输入数组中所有元素的指数 |
| np.exp2(x) | 计算输入数组中所有p的2 ** p |
| np.rint(x) | 四舍五入最接近的整数 |
| round(x,2) | 保留两位小数四舍五入 |
| np.fabs(x) | 以元素方式计算绝对值 |
| np.sqrt(x) | 以元素方式返回数组的非负平方根 |
| np.cbrt(x) | 以元素方式返回数组的立方根 |
| pow(a,1/n) | 返回int,n次方根 |
| np.reciprocal(x) | 以元素为单位返回参数的倒数 |
| np.gcd(x1,x2) | 返回x1,x2的最大公约数 |
| np.lcm(x1,x2) | 返回x1,x2的最小公倍数 |
三角函数
| 函数 | 说明 |
|---|---|
| np.sin(x) | 三角正弦 |
| np.cos() | 余弦 |
| np.tan(x) | 计算切线 |
| np.arcsin(x) | 反正弦 |
| np.arccos(x) | 反余弦 |
| np.sinh(x) | 双曲正弦 |
| np.cosh(x) | 双曲余弦 |
| np.tanh(x) | 双曲正切 |
浙公网安备 33010602011771号