simulate 中的一些操作

1. neutralize:

position based 的alpha

int neutralize(int di, int ti) {
  double sum = 0;
  double abssum = 0;
  int count = 0;
  for (int ii = 0; ii < nsyms; ++ii) {
    if (std::isfinite(pos(di, ii))) {
      sum += pos(di, ii);
      count++;
    } else if (std::isinf(pos(di, ii))) {
      pos(di, ii) = NaN;
    }
  }

  if (count != 0) {
    double mean = sum / count;
    for (int ii = 0; ii < nsyms; ++ii) {
      if (std::isfinite(pos(di, ii))) {
        abssum += fabs(pos(di, ii) - mean);
        pos(di, ii) = pos(di, ii) - mean;
      }
    }
  }

  if (abssum != 0) {
    for (int ii = 0; ii < nsyms; ++ii) {
      if (std::isfinite(pos(di, ii))) {
        pos(di, ii) *= 1.0 / abssum;
      }
    }
  }
  return 0;
}

2. operators definition(二维矩阵,行为日期,列为股票):

// 对当前股票t天值的操作

ts_sum(ts_matrix x, int t)  从当前天往前t天的值之和

ts_max(ts_matrix x, int t)  从当前天往前t天的值中的最大值

ts_min(ts_matrix x, int t) 从当前天往前t天的值中的最小值

ts_argmax(ts_matrix x, int) 从当前天往前t天的值中的最大值的索引

ts_argmin(ts_matrix x, int t) 从当前天往前t天的值中的最小值的索引

ts_count(ts_matrix x, int t) 从当前天往前t天中有效值的个数(除去nan和inf值)

ts_mean(ts_matrix x, int t) 从当前天往前t天所有值的平均值(如果输入的位置上是nan,则输出不一定为nan)

ts_norm(ts_matrix x, int t) 当前值除以前t天的平均值

ts_std_norm(ts_matrix x, int t) 当前值除以前t天的方差

ts_mean_linear(ts_matrix x, int t) 从当前天往前t天所有值的平均值,但权重依次递减(t, t-1, t-2, ...,1)。(输入位置上为nan,输出不一定)

ts_mean_exp(ts_matrix x, int t, double e) 从当前天往前t天所有值的平均值,权重为指数递减(pow(1-e, 0), pow(1-e, 1), ..., pow(1-e, t-1))。(输入位置上为nan,输出不一定)

ts_mean_halflife(ts_matrix x, int t, int halflife) 从当前天往前t天所有值的平均值,权重为指数递减(pow(1-e, 0), pow(1-e, 1), ..., pow(1-e, t-1),其中e=1-pow(0.5, 1/halflife))。(输入位置上为nan,输出不一定)

ts_delay(ts_matrix x, int t) 当前天的值为t天前的值

ts_delta(ts_matrix x, int t) 当前天的值与t天前的值之差

ts_rank(ts_matrix x, int t) 把包含当前天在内的t天内的值归于0-1之间,值越大,rank之后的值越大。比如(1,3,4,2,5)rank之后为(0,0.5, 0.75,0.25,1)

ts_quantile(ts_matrix x, int t) 返回包含当前天在内的t天的百分之t的值

ts_std(ts_matrix x, int t) 包含当前天在内的t天的标准差

ts_zscore(ts_matrix x, int t) 当前天的值减去前t天的均值再除以前t天的标准差

ts_fill(ts_matrix x, int t) 用前一天的值填充当前天的值

ts_corr(ts_matrix x, ts_matrix y, int t) x和y之间前t天的相关关系

ts_cov(ts_matrix x, ts_matrix y, int t) x和y之间前t天的协方差

ts_prod(ts_matrix x, int t) 包含当前天在内的前t天的值相乘

ts_moment(ts_matrix x, int k, int t) 包含当前天在内的前t天的k阶矩

ts_skew(ts_matrix x, int t) 包含当前天在内的前t天的3阶矩除以标准差的三次方(倾斜度)

ts_kurt(ts_matrix x, int t) 包含当前天在内的前t天的四阶矩除以标准差的四次方(峰度)

ts_regression(ts_matrix x, ts_matrix y, int t) x和y的前t天的线性回归

ts_KthValidValue(ts_matrix x, int k, int t) 从当前天往前数t天,返回其中第个有效的值,若没有,则返回nan

 

// 对所有股票所有天的值操作

at_isnan(ts_matrix x) 值为nan返回1,否则返回0

at_isinf(ts_matrix x) 值为inf返回1,否则返回0

at_nan2zero(ts_matrix x) 将x中所有为nan的值转为0

at_zero2nan(ts_matrix x) 将x中为0的值转为nan

at_inf2nan(ts_matrix x) 将x中为inf的值转为nan

at_sign(ts_matrix x) 将x进行符号变换,即大于0的值为1,小于0的值为-1

at_signlog(ts_matrix x) 对x进行符号变换和log函数,然后将两者相乘

at_sqrt(ts_matrix x) 对x进行开方处理

at_signsqrt(ts_matrix x) 对x进行符号变换和开方处理,然后将两者相乘

at_signpower(ts_matrix x, double e) / at_signpower(ts_matrix x, ts_matrix y) 对x进行符号变化和e次方,然后将两者相乘 / 对x进行符号变换和对应位置的y次方,然后将两者相乘

at_power(ts_matrix x, double e) / at_power(ts_matrix x, ts_matrix y) x的e次方 / 对应位置x的y次方

at_abs(ts_matrix x) 对x取绝对值

at_round(ts_matrix x) 对x四舍六入五凑偶取整

at_floor(ts_matrix x) 小于等于x的最大整数

at_ceil(ts_matrix x) 大于x的最小整数

at_cond(ts_matrix c, ts_matrix x, ts_matrix y) 若c大于0,取x的值,否则取y的值

at_max(ts_matrix x, ts_matrix y) 取x,y中的最大值

at_min(ts_matrix x, ts_matrix y) 取x,y中的最小值

at_humdecay(ts_matrix x, double hump) 从昨天到今天的变化大于hump,取今天的值,否则取昨天的值(fabs(x_today - x_yest) / x_yest >= hump ? x_today, x_yest)

at_lastdiffvalue(ts_matrix x) 返回历史中最近的一个不同的值,只要用于fundamental的数据,值不经常变化

at_tail(ts_matrix x, double lower, double upper, double newval) 如果x的值在lower和upper之间,则使用newval,否则保持不变

at_middle(ts_matrix x, double lower, double upper, double newval) 如果x的值小于lower或者大于upper,则使用newval,否则保持不变

at_days_from_last_change(ts_matrix x) 如果今天的值与昨天的值不一样,则返回0,如果一样,则返回前面同样值的个数

at_days_from_last_appear(ts_matrix x, double value)  如果今天的值与value一样,则返回0,如果不一样,在返回前面不同值的个数

at_tradewhen(ts_matrix trigger, ts_matrix x, ts_matrix exit) 如果exit大于0,则返回nan,如果trigger大于0返回当前值,其他返回上一天的值

 

// 对当天的所有股票值的操作

cs_mean(ts_matrix x) 每天所有股票的均值

cs_neut(ts_matrix x) 每天所有股票的值减去相对应的均值

cs_rank(ts_matrix x) 把每天所有股票的值归于0-1之间,股票值越大,rank后值越大

cs_remove_middle(ts_matrix x, double pct) 移除每天值在中间的股票,pct表示保留多少尾部。pct=0.8表示移除中间数据的80%,保留开始和结束的10%。需要先做rank处理,再判断(只在尾部上的值进行交易,可以获得更高的收益,但会导致更高的turnover)

cs_remove_outlier(ts_matrix x, double pct) 移除每天值在尾部的股票,pct表示保留中间多少。pct=0.4表示移除头部20%,尾部20%,保留中间60%

cs_scale(ts_matrix x) 每天所有股票当前值除以该天所有股票绝对值的和

cs_zscore(ts_matrix x) 每天所有股票当前值减去对应的平均值在除以方差

cs_groupcount(ts_matrix x, ts_matrix group) 每天属于某个组的股票的个数

cs_groupmax(ts_matrix x, ts_matrix group) 每天属于某个组的股票的最大值

cs_groupmin(ts_matrix x, ts_matrix group) 每天属于某个组的股票的最小值

cs_groupstd(ts_matrix x, ts_matrix group) 每天属于某个组的股票的标准差

cs_groupsum(ts_matrix x, ts_matrix group) 每天属于某个组的股票值的和

cs_groupzscore(ts_matrix x, ts_matrix group) 每天属于某个组的股票当前值减去对应的平均值再除以标准差

cs_groupscale(ts_matrix x, ts_matrix group) 每天属于某个组的股票当前值处于该组所有股票绝对值之和

cs_groupindex(ts_matrix x, int ngroups) 创建一个组,根据输入的rank,即rank(x),把输入的股票平均分为n个组。

cs_grouprank(ts_matrix x, ts_matrix group) 每天属于某个组的所有股票进行rank,即归于0-1之间

cs_groupquantile(ts_matrix x, ts_matrix group, double quantile) 每天属于某个组的分位数quantile的值

cs_groupmean(ts_matrix x, ts_matrix group) 每天属于某个组的所有股票值的平均

cs_groupneut(ts_matrix x, ts_matrix group) 每天属于某个组的值减去对应组的平均值

cs_regression(ts_matrix y, ts_matrix x) y与x作线性回归

 

3. operators definition(一维数组:某一天的所有股票)

sv_norm(sv_array x) 当前值除以该组的均值

sv_std(sv_array x) 该组的标准差

sv_std_norm(sv_array x) 当前值除以该组的标准差

sv_corr(sv_array x, sv_array y) x和y的相关系数

sv_cov(sv_array x, sv_array y) x和y的协方差

sv_remove_middle(sv_array x, double pct) 移除该组中每天值在中间的股票

sv_remove_outlier(sv_array x, double pct) 移除该组中每天值在头部尾部的股票

sv_groupneut(sv_array x, sv_array group) 每天属于某个组的当前值减去对应组的平均值

at_isnan(sv_array x) 该组中为nan的值转化为1,其他的为0

at_isinf(sv_array x) 该组中为inf的值转化为1,其他的为0

at_nan2zero(sv_array x) 该组中nan的值转化为0

at_zero2nan(sv_array x) 该组中0转化为nan

at_inf2nan(sv_array x) 该组中inf值转化为nan

at_sign(sv_array x) 对该组进行符号操作,大于0为1,小于0为-1

at_signlog(sv_array x) 对该组进行符号操作和log操作,然后将两者相乘

at_sqrt(sv_array x) 对该组进行开方操作

at_signsqrt(sv_array x) 对该组进行符号操作和开方操作,然后将两者相乘

at_power(sv_array x, double e) / at_power(sv_array x, sv_array y) 对该组进行e次方 / y次方

at_signpower(sv_array x, double e) / at_power(sv_array x, sv_array y) 对该组进行符号操作和e次方 / y次方,然后将两者相乘

at_abs(sv_array x) 取绝对值

at_round(sv_array x) 进行四舍六入五凑偶

at_floor(sv_array x) 该组小于等于x的最大整数

at_ceil(sv_array x) 大于x的最小整数

at_max(sv_array x, sv_array y) x和y之间的最大值

at_min(sv_array x, sv_array y) x和y之间的最小值

at_tail(sv_array x, double lower, double upper, double newval) 该组中在lower和upper之间的值设为newval(即保留两端的值)

at_middle(sv_array x, double lower, double upper, double newval) 该组中大于upper或者小于lower的值设为newal(即保留中间值)

sv_mean(sv_array x) 该组的平均值

sv_rank(sv_array x) 将该组的值归于0-1

sv_scale(sv_array x) 该组当前值除以该组所有值绝对值之和

sv_neut(sv_array x) 该组当前值减去该组的平均值

sv_quantile(sv_array x, double quantile) 该组的分位数的值(返回值是同一个值,nan另外)

sv_zscore(sv_array x) 该组的当前值减去平均值除以该组的标准差

sv_groupcount(sv_array x, sv_array group) 属于某个组的股票的个数

sv_groupmax(sv_array x, sv_array group) 属于某个组的股票值的最大值

sv_groupmin(sv_array x, sv_array group) 属于某个组的股票的最小值

sv_groupstd(sv_array x, sv_array group) 属于某个组的股票的标准差

sv_groupsum(sv_array x, sv_array group) 属于某个组的股票值之和

sv_groupzscore(sv_array x, sv_array group) 属于某个组的股票当前值减去该组的平均值再除以该组的标准差

sv_groupscale(sv_array x, sv_array group) 属于某个组的股票当前值除以该组的所有值绝对值之和

sv_groupindex(sv_array x, int ngroups) 返回一个组:将输入x平均的分配到n个组中(使用sv_rank进行处理)

sv_grouprank(sv_array x, sv_array group) 属于某个组的所有股票进行rank,归于0-1之间

sv_groupquantile(sv_array x, sv_array group, double quantile) 属于某个组股票的分位值

sv_groupmean(sv_array x, sv_array group) 属于某个组的股票的平均值

at_cond(sv_array c, sv_array x, sv_array y) c大于0为x,其他为y

sv_regression(sv_array y, sv_array x) y和x线性回归

 

posted @ 2019-09-17 19:47  c++11  阅读(750)  评论(0编辑  收藏  举报