因子相关性分析
User: OLS Regression Results
==============================================================================
Dep. Variable: 利润 R-squared: 0.022
Model: OLS Adj. R-squared: 0.022
Method: Least Squares F-statistic: 799.0
Date: Tue, 18 Feb 2025 Prob (F-statistic): 0.00
Time: 19:44:48 Log-Likelihood: -5.3922e+06
No. Observations: 1644755 AIC: 1.078e+07
Df Residuals: 1644707 BIC: 1.079e+07
Df Model: 47
Covariance Type: nonrobust
=======================================================================================
coef std err t P>|t| [0.025 0.975]
---------------------------------------------------------------------------------------
const 0.6751 0.053 12.723 0.000 0.571 0.779
LB -0.0465 0.003 -14.068 0.000 -0.053 -0.040
HS -0.0004 7.31e-05 -4.854 0.000 -0.000 -0.000
分钟HS -0.6280 0.029 -21.519 0.000 -0.685 -0.571
ASKBID -1.1917 0.025 -48.599 0.000 -1.240 -1.144
ZF -0.2131 0.010 -20.376 0.000 -0.234 -0.193
分钟LB -0.0587 0.008 -7.665 0.000 -0.074 -0.044
分钟ZF -1.2224 0.247 -4.945 0.000 -1.707 -0.738
nowMA5 3.4955 0.154 22.648 0.000 3.193 3.798
涨停次数30天 0.0064 0.006 1.129 0.259 -0.005 0.017
ZT_CS_60 0.0255 0.004 6.439 0.000 0.018 0.033
NOWLOWZF -0.0921 0.012 -7.578 0.000 -0.116 -0.068
昨日涨幅 -0.0319 0.001 -25.678 0.000 -0.034 -0.029
开盘涨幅 0.1974 0.010 19.289 0.000 0.177 0.217
big_order 0.0021 0.000 5.273 0.000 0.001 0.003
vol_inc_cnt -0.0277 0.002 -15.626 0.000 -0.031 -0.024
流通市值 -6.386e-05 8.84e-06 -7.225 0.000 -8.12e-05 -4.65e-05
相对位置 -0.0018 0.000 -4.963 0.000 -0.002 -0.001
相对位置2 0.0019 0.000 4.886 0.000 0.001 0.003
zjs -0.0002 1.23e-05 -13.956 0.000 -0.000 -0.000
zf5js 0.0054 0.000 14.650 0.000 0.005 0.006
ztjs 0.0030 0.001 3.266 0.001 0.001 0.005
onemin_num 0.0007 1.48e-05 48.938 0.000 0.001 0.001
ask_money -6.223e-05 3.56e-06 -17.487 0.000 -6.92e-05 -5.53e-05
bid_money 8.263e-06 2.2e-07 37.554 0.000 7.83e-06 8.69e-06
平均笔数 -0.0005 0.000 -2.391 0.017 -0.001 -8.34e-05
分钟秒比 -0.0061 0.000 -15.681 0.000 -0.007 -0.005
GUESS正大单 5.561e-05 4.1e-06 13.576 0.000 4.76e-05 6.36e-05
GUESS大单率 0.0010 0.000 5.530 0.000 0.001 0.001
GUESS大单个数 -0.0764 0.005 -16.967 0.000 -0.085 -0.068
GUESS大单pos个数 0.0387 0.007 5.466 0.000 0.025 0.053
askmoney_div_平均笔数 0.0003 8.67e-05 3.937 0.000 0.000 0.001
totalmoney_div_成交笔数 5.725e-06 3.72e-07 15.389 0.000 5e-06 6.45e-06
nowma10 -2.1698 0.153 -14.187 0.000 -2.470 -1.870
pos_div_askallmoney -0.0004 0.000 -2.664 0.008 -0.001 -0.000
ma5_c -0.0005 0.000 -3.957 0.000 -0.001 -0.000
ma5_v 5.071e-09 1.46e-10 34.789 0.000 4.79e-09 5.36e-09
ASK20 0.0386 0.034 1.122 0.262 -0.029 0.106
ASK10 0.1311 0.040 3.308 0.001 0.053 0.209
now_low_onemin -0.0839 0.013 -6.477 0.000 -0.109 -0.059
now_high_onemin -0.1335 0.012 -11.493 0.000 -0.156 -0.111
allask_cntrb -0.0030 0.001 -2.063 0.039 -0.006 -0.000
avgask_cntrb 1.73e-05 1.49e-05 1.158 0.247 -1.2e-05 4.66e-05
avgbid_cntrb 0.0009 0.000 2.502 0.012 0.000 0.002
板块涨家数比例 -0.0040 0.000 -9.932 0.000 -0.005 -0.003
板块排名 -0.0038 0.000 -25.343 0.000 -0.004 -0.003
股票在板块中的排名 -0.0044 0.000 -16.859 0.000 -0.005 -0.004
板块股票个数 0.0015 0.000 8.963 0.000 0.001 0.002
==============================================================================
Omnibus: 1258174.856 Durbin-Watson: 1.712
Prob(Omnibus): 0.000 Jarque-Bera (JB): 648008431.190
Skew: 2.519 Prob(JB): 0.00
Kurtosis: 100.110 Cond. No. 2.39e+09
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
[2] The condition number is large, 2.39e+09. This might indicate that there are
strong multicollinearity or other numerical problems.
Kimi: 从你提供的回归结果来看,这是一个使用普通最小二乘法(OLS)估计的线性回归模型,因变量是“利润”,自变量包括了多个解释变量。以下是对结果的分析和一些需要注意的地方:
### 1. **模型整体拟合情况**
- **R-squared 和 Adjusted R-squared**:模型的 R-squared 为 0.022,Adjusted R-squared 也为 0.022,表明模型对因变量的解释能力非常弱,只有 2.2% 的变异能够被模型解释。
- **F-statistic**:F 统计量为 799.0,且 Prob (F-statistic) 为 0.000,表明模型在统计上显著优于零模型,即至少有一个自变量对因变量有显著影响。
### 2. **变量的显著性和系数**
- **显著性**:大部分自变量的 P 值小于 0.05,表明这些变量在统计上显著影响因变量。例如:
- `LB`、`HS`、`ASKBID`、`ZF` 等变量的 P 值为 0.000,表明它们对利润有显著影响。
- `涨停次数30天` 的 P 值为 0.259,表明其对利润的影响不显著。
- **系数的正负**:
- 负系数(如 `ASKBID`、`ZF`、`昨日涨幅` 等)表明这些变量与利润呈负相关。
- 正系数(如 `nowMA5`、`开盘涨幅`、`big_order` 等)表明这些变量与利润呈正相关。
### 3. **模型的诊断**
- **Omnibus 和 Jarque-Bera 检验**:
- Omnibus 和 Jarque-Bera 检验的 P 值均为 0.000,表明残差不符合正态分布。这可能会影响推断统计的有效性。
- **Skewness 和 Kurtosis**:
- 残差的偏度(Skewness)为 2.519,峰度(Kurtosis)为 100.110,表明残差分布严重偏离正态分布。
- **Durbin-Watson 检验**:
- Durbin-Watson 值为 1.712,接近 2,表明残差序列自相关性不明显。
- **条件数(Condition Number)**:
- 条件数为 2.39e+09,非常大,表明模型可能存在严重的多重共线性或其他数值问题。这可能导致系数估计不稳定,标准误可能被低估。
### 4. **建议**
1. **检查多重共线性**:
- 使用方差膨胀因子(VIF)检查自变量之间的多重共线性。如果某些变量的 VIF 值大于 5 或 10,考虑删除或合并这些变量。
2. **数据转换或模型改进**:
- 考虑对因变量或自变量进行变换(如对数变换)以改善模型的拟合效果。
- 尝试使用正则化回归(如岭回归或 Lasso 回归)来处理多重共线性问题。
3. **残差分析**:
- 检查残差的分布情况,考虑是否存在异常值或杠杆点影响模型估计。
4. **模型简化**:
- 考虑逐步回归或其他变量选择方法,剔除不显著的变量,以简化模型并提高解释能力。
### 5. **总结**
虽然模型在统计上显著,但 R-squared 很低,表明模型对利润的解释能力有限。同时,多重共线性和残差分布问题需要进一步处理。建议对数据和模型进行更深入的诊断和调整,以提高模型的可靠性和实用性。
User: 请挨个解释下各个因子是否显著
Kimi: 好的!以下是对回归结果中各个自变量的显著性解释。显著性主要通过 **P 值** 来判断,通常以 **P < 0.05** 作为显著性标准。如果 P 值小于 0.05,则认为该变量对因变量(利润)有显著影响;如果 P 值大于 0.05,则认为影响不显著。
### **显著变量(P < 0.05)**
1. **`const`(常数项)**
- **系数**:0.6751
- **P 值**:0.000
- **显著性**:显著
- **解释**:常数项显著,表示在所有自变量为零的情况下,因变量(利润)的基准值为 0.6751。
2. **`LB`**
- **系数**:-0.0465
- **P 值**:0.000
- **显著性**:显著
- **解释**:`LB` 对利润有负向影响,且影响显著。
3. **`HS`**
- **系数**:-0.0004
- **P 值**:0.000
- **显著性**:显著
- **解释**:`HS` 对利润有负向影响,且影响显著。
4. **`分钟HS`**
- **系数**:-0.6280
- **P 值**:0.000
- **显著性**:显著
- **解释**:`分钟HS` 对利润有较强的负向影响,且影响显著。
5. **`ASKBID`**
- **系数**:-1.1917
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ASKBID` 对利润有很强的负向影响,且影响显著。
6. **`ZF`**
- **系数**:-0.2131
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ZF` 对利润有负向影响,且影响显著。
7. **`分钟LB`**
- **系数**:-0.0587
- **P 值**:0.000
- **显著性**:显著
- **解释**:`分钟LB` 对利润有负向影响,且影响显著。
8. **`分钟ZF`**
- **系数**:-1.2224
- **P 值**:0.000
- **显著性**:显著
- **解释**:`分钟ZF` 对利润有较强的负向影响,且影响显著。
9. **`nowMA5`**
- **系数**:3.4955
- **P 值**:0.000
- **显著性**:显著
- **解释**:`nowMA5` 对利润有正向影响,且影响显著。
10. **`ZT_CS_60`**
- **系数**:0.0255
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ZT_CS_60` 对利润有正向影响,且影响显著。
11. **`NOWLOWZF`**
- **系数**:-0.0921
- **P 值**:0.000
- **显著性**:显著
- **解释**:`NOWLOWZF` 对利润有负向影响,且影响显著。
12. **`昨日涨幅`**
- **系数**:-0.0319
- **P 值**:0.000
- **显著性**:显著
- **解释**:`昨日涨幅` 对利润有负向影响,且影响显著。
13. **`开盘涨幅`**
- **系数**:0.1974
- **P 值**:0.000
- **显著性**:显著
- **解释**:`开盘涨幅` 对利润有正向影响,且影响显著。
14. **`big_order`**
- **系数**:0.0021
- **P 值**:0.000
- **显著性**:显著
- **解释**:`big_order` 对利润有正向影响,且影响显著。
15. **`vol_inc_cnt`**
- **系数**:-0.0277
- **P 值**:0.000
- **显著性**:显著
- **解释**:`vol_inc_cnt` 对利润有负向影响,且影响显著。
16. **`流通市值`**
- **系数**:-6.386e-05
- **P 值**:0.000
- **显著性**:显著
- **解释**:`流通市值` 对利润有负向影响,且影响显著。
17. **`相对位置`**
- **系数**:-0.0018
- **P 值**:0.000
- **显著性**:显著
- **解释**:`相对位置` 对利润有负向影响,且影响显著。
18. **`相对位置2`**
- **系数**:0.0019
- **P 值**:0.000
- **显著性**:显著
- **解释**:`相对位置2` 对利润有正向影响,且影响显著。
19. **`zjs`**
- **系数**:-0.0002
- **P 值**:0.000
- **显著性**:显著
- **解释**:`zjs` 对利润有负向影响,且影响显著。
20. **`zf5js`**
- **系数**:0.0054
- **P 值**:0.000
- **显著性**:显著
- **解释**:`zf5js` 对利润有正向影响,且影响显著。
21. **`ztjs`**
- **系数**:0.0030
- **P 值**:0.001
- **显著性**:显著
- **解释**:`ztjs` 对利润有正向影响,且影响显著。
22. **`onemin_num`**
- **系数**:0.0007
- **P 值**:0.000
- **显著性**:显著
- **解释**:`onemin_num` 对利润有正向影响,且影响显著。
23. **`ask_money`**
- **系数**:-6.223e-05
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ask_money` 对利润有负向影响,且影响显著。
24. **`bid_money`**
- **系数**:8.263e-06
- **P 值**:0.000
- **显著性**:显著
- **解释**:`bid_money` 对利润有正向影响,且影响显著。
25. **`平均笔数`**
- **系数**:-0.0005
- **P 值**:0.017
- **显著性**:显著
- **解释**:`平均笔数` 对利润有负向影响,且影响显著。
26. **`分钟秒比`**
- **系数**:-0.0061
- **P 值**:0.000
- **显著性**:显著
- **解释**:`分钟秒比` 对利润有负向影响,且影响显著。
27. **`GUESS正大单`**
- **系数**:5.561e-05
- **P 值**:0.000
- **显著性**:显著
- **解释**:`GUESS正大单` 对利润有正向影响,且影响显著。
28. **`GUESS大单率`**
- **系数**
:0.0010
- **P 值**:0.000
- **显著性**:显著
- **解释**:`GUESS大单率` 对利润有正向影响,且影响显著。
29. **`GUESS大单个数`**
- **系数**:-0.0764
- **P 值**:0.000
- **显著性**:显著
- **解释**:`GUESS大单个数` 对利润有负向影响,且影响显著。
30. **`GUESS大单pos个数`**
- **系数**:0.0387
- **P 值**:0.000
- **显著性**:显著
- **解释**:`GUESS大单pos个数` 对利润有正向影响,且影响显著。
31. **`askmoney_div_平均笔数`**
- **系数**:0.0003
- **P 值**:0.000
- **显著性**:显著
- **解释**:`askmoney_div_平均笔数` 对利润有正向影响,且影响显著。
32. **`totalmoney_div_成交笔数`**
- **系数**:5.725e-06
- **P 值**:0.000
- **显著性**:显著
- **解释**:`totalmoney_div_成交笔数` 对利润有正向影响,且影响显著。
33. **`nowma10`**
- **系数**:-2.1698
- **P 值**:0.000
- **显著性**:显著
- **解释**:`nowma10` 对利润有负向影响,且影响显著。
34. **`pos_div_askallmoney`**
- **系数**:-0.0004
- **P 值**:0.008
- **显著性**:显著
- **解释**:`pos_div_askallmoney` 对利润有负向影响,且影响显著。
35. **`ma5_c`**
- **系数**:-0.0005
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ma5_c` 对利润有负向影响,且影响显著。
36. **`ma5_v`**
- **系数**:5.071e-09
- **P 值**:0.000
- **显著性**:显著
- **解释**:`ma5_v` 对利润有正向影响,且影响显著。
37. **`ASK10`**
- **系数**:0.1311
- **P 值**:0.001
- **显著性**:显著
- **解释**:`ASK10` 对利润有正向影响,且影响显著。
38. **`now_low_onemin`**
- **系数**:-0.0839
- **P 值**:0.000
- **显著性**:显著
- **解释**:`now_low_onemin` 对利润有负向影响,且影响显著。
39. **`now_high_onemin`**
- **系数**:-0.1335
- **P 值**:0.000
- **显著性**:显著
- **解释**:`now_high_onemin` 对利润有负向影响,且影响显著。
40. **`allask_cntrb`**
- **系数**:-0.0030
- **P 值**:0.039
- **显著性**:显著
- **解释**:`allask_cntrb` 对利润有负向影响,且影响显著。
41. **`avgbid_cntrb`**
- **系数**:0.0009
- **P 值**:0.012
- **显著性**:显著
- **解释**:`avgbid_cntrb` 对利润有正向影响,且影响显著。
42. **`板块涨家数比例`**
- **系数**:-0.0040
- **P 值**:0.000
- **显著性**:显著
- **解释**:`板块涨家数比例` 对利润有负向影响,且影响显著。
43. **`板块排名`**
- **系数**:-0.0038
- **P 值**:0.000
- **显著性**:显著
- **解释**:`板块排名` 对利润有负向影响,且影响显著。
44. **`股票在板块中的排名`**
- **系数**:-0.0044
- **P 值**:0.000
- **显著性**:显著
- **解释**:`股票在板块中的排名` 对利润有负向影响,且影响显著。
45. **`板块股票个数`**
- **系数**:0.0015
- **P 值**:0.000
- **显著性**:显著
- **解释**:`板块股票个数` 对利润有正向影响,且影响显著。
### **不显著变量(P ≥ 0.05)**
1. **`涨停次数30天`**
- **系数**:0.0064
- **P 值**:0.259
- **显著性**:不显著
- **解释**:`涨停次数30天` 对利润的影响不显著。
2. **`ASK20`**
- **系数**:0.0386
- **P 值**:0.262
- **显著性**:不显著
- **解释**:`ASK20` 对利润的影响不显著。
3. **`avgask_cntrb`**
- **系数**:1.73e-05
- **P 值**:0.247
- **显著性**:不显著
- **解释**:`avgask_cntrb` 对利润的影响不显著。
### **总结**
- **显著变量**:大部分变量对利润的影响显著,且正负方向明确。
- **不显著变量**:少数变量(如 `涨停次数30天` 和 `ASK20`)对利润的影响不显著,可以考虑从模型中移除以简化模型。
- **模型改进**:虽然很多变量显著,但 R-squared 很低,表明模型整体解释能力有限。建议进一步优化模型,例如处理多重共线性、尝试变量转换或使用正则化回归。

浙公网安备 33010602011771号