Qlib 学习资料收集1

Qlib 一直在学习,官方文档细节不全,收费前人留下的资料。

 1、微软AI量化投资平台Qlib体验——华泰人工智能系列之四十       https://www.sohu.com/a/507908728_120099896

      from qlib.contrib.data.handler import Alpha158

      h = Alpha158(**data_handler_config)       --  计算从start_time至end_time的当期因子值和下期收益,分别作为后续AI模型训练的特征和标签。

     (1) 因子生成参数 data_handler_config 相当于配置文件,字典类型,用来定义完整数据起止日期(start_time和end_time),拟合数据起止日期(fit_start_time和fit_end_time),股票池(instruments)等。拟合数据起止日期区间应为完整数据起止日期数据的子集。拟合数据日期(训练和验证集)和余下日期(测试集)在数据预处理的方式上有所不同。看官方文档/代码,一直不明所以。

     h.get_cols()  获取 h(dataFrame)的所有列名。

    h.fetch(col_set=’label’)  指令可获取标签。

    h.fetch(col_set=’feature’)指令可获取特征。默认参数下,股票t日的特征对应t日收盘后计算出的因子值。

    (2)模型训练参数task 为字典类型,较复杂,也是整个模型的核心部分,又可以分为 mode l和 dataset 两个字典。

            第一项 model 为AI模型参数,必须包含class(AI模型名称)和module_path(AI模型所在路径)两个子键;kwargs为model的可选子键,通过kwargs设置指定AI模型的超参数。

            第二项 dataset 为数据集参数,必须包含class(数据集名称)和module_path(数据集所在路径)两个子键;kwargs为dataset的可选子键,通过kwargs设置指定数据集的参数。

     (3)选股策略、回测参数 port_analysis_config,该参数为字典类型,又可以分为 strategy 和 backtest 两个子键。

           第一项 strategy 为策略参数,例如此处使用TopkDropout策略,每日等权持有topk=50只股票,同时每日卖出持仓股票中最新预测收益最低的n_drop=5只股票,

                      买入未持仓股票中最新预测收益最高的n_drop=5只股票。

           第二项 backtest 为回测参数,用于设置涨跌停限制、起始资金、业绩比较基准、成交价格、交易费率等信息。

                          image image

 

posted @ 2025-08-26 14:55  Hopesun  阅读(205)  评论(0)    收藏  举报