问答交流

【其他】为啥同样的模型,同样的因子,2个模板跑出来的结果天差地别

由bqj3l2oq创建,最终由jayjaypp 被浏览 36 用户

2个相同的模板,参数一样,数据一样,同样的因子,换了个模板,结果天差地别,到底是哪里出现了问题,

哪个是正确的,哪个出问题了\n\n第一个是新建的模板策略

https://bigquant.com/codesharev3/e00be70e-dc29-4df0-b7b2-516258ddf9bd


第二个是周一直播分享的机器学习模板

https://bigquant.com/codesharev3/38c7cd41-faee-4c1e-83ab-09680b2f1d59

\

标签

因子分析
评论
  • 求帮忙解答,研究了一晚上都没搞清楚
  • 中间还有很多步骤都会导致回测差异,建议你按照以下步骤进行排查:
  • 1. 对比两个策略的训练集和测试集是否一致,如果不一致,则向前逐步排查哪一步导致数据不一致。
  • 2. 看下模型预测结果数据是否一致,如果一致,则在回测引擎里面打印具体的委托情况,如果发现委托不一致,则看下当天的数据是否有差异。重点看下因子值相同时,股票顺序是否不一致。
  • 必定会不一样
  • 1.过滤条件
  • st_status==0 & price_limit_status==2 | price_limit_status ==3 & low>low_1
  • 一个是前置过滤,一个是后置过滤。影响最大的是打标 label 值很不一样。
  • all_cbins(_clipped_return, 70) AS _binned_return 是对全局数据 打70个标label
  • 前者 是前置过滤 ,打标时数据 必定比 后者少。
  • 也就是前者 是先过滤完数据再打标, 后者是先全局数据打标,再过滤数据。
  • 2.过滤条件 不一致
  • 后者过滤是带有 | 或 ,前者没有
  • 总结就是训练数据不一样
{link}