BigQuant 2026年度私享会

因子投研中的风格偏向及因子风格分析框架

由bqgl97s8创建,最终由bqgl97s8 被浏览 29 用户

因子应用时应注意穿透真实风格

老韵前段时间分享了因子批量测试的工具,见因子研究工具:批量因子测评,自适应多空方向。当我们测试到一些数据特别好的因子时,是不是就迫不及待地去想使用?

以下为cn_stock_factors_hf库里近6年的测试结果,年化收益率排前的数据确实喜人,你会发现这些成绩都超过绝大多数常规因子与高频因子。

那这里面又是有什么魔法吗?先别高兴太早!其实我们看特大单卖出金额,它是一个绝对金额,那么什么样的股票这个金额会大?豪无疑问,至少得是大市值的股票。这个指标是负向的,所以穿透其真实属性,其实就决定了它必然就是小市值策略;只是说,还包含了所谓大单的数据信息。那么,在这相当长时间近十年小市值都表现非常突出的情况下,其他信息带来的区别就已经可以忽略了,这也是为什么大单买入金额与大单卖出金额,在买卖两个性质完全相反的指标,其表现是同向的且年化回报和夏普都惊人一致的原因:不是因为是否是买还是卖,也不在乎是大单的还是特大单还是中单甚至小单,而是这个金额本身,与其股票的市值大小是高度相关的!

大单、特大单金额或笔数因子相关性抽查

因子投研中应特别重视分格特性

同样,在因子投研中,要特别注意风格的偏向。当我们魔改一类因子时,一定要注意风格的影响,不要看到某个特征的收益率高就改过去,也许就丢失了那些独立风格的更宝贵的特征。比如,在曹春晓老师分享的滴水穿石因子一文中(原文链接),相关性如下:

可以看出,其与流动性相关性最高,与市值相关性不算太高。但是,如果我们对它进行魔改——

这里举例我用cowork辅助进行的第二轮魔改(m3版本)。其魔改思路:


🚀 三大核心创新 创新1: MAD裁剪 + 自适应阈值

创新2: 买卖方向分离

分别构建买卖方向的周期波动以及买卖力量对比

创新3: 量价协同周期性

另外再加上第二版有效的盘口冲击,大单持续性两个子因子,构成一个非常复杂的综合因子,最高可将原约27%的年化提升到36%。但是!一测相关度,其中四个子因子市值相关度都非常高,导致综合因子对市值相关度也非常高:

这个与市值相关度超过0.5的因子,与原来市值相关性(绝对值)16.6%相差太远,显然不是我所要的。

让我们来看看市值风格是怎样混入的?我让cowork分析如下:

大盘股

  • 机构主导 → VWAP算法 → 规律性交易
  • 成交量有周期性脉冲wavelet_energy
  • 因子值 = 标准化后的值 →

小盘股

  • 散户/游资主导 → 随机交易

  • 成交量无规律wavelet_energy

  • 因子值 = 标准化后的值 →

    \

当然,这个解释还有些牵强,但魔改买卖分离、上涨下跌分离后,相关指标带上了更强的市值特征是豪无疑问的。但是呢,也还有很中性化的几个分支因子:买卖力量对比,量价同步性,盘口冲击,大单持续性。事实上,如果我去掉或只小权重的加入强市值特征,以偏中性化的子因子为主,还是能构筑很强悍的综合因子的:年化0.3344,比原来有20%+的提升。更重要的是,它的市值相关度(绝对值)已经到了12.9%,比原始因子更小,流动性风格也由原来的34%降到了17.2%,豪无疑问,这已经是一个相对全新的因子了。

排除或降低市值权重因子后构筑的综合因子

\

因子分格分析框架(代码)

最后,分享由老韵出主意,cowork辅助生成的因子风格分析框架:

https://bigquant.com/codesharev3/8457a39a-45a3-4af8-bb38-c00f068c4868

\

{link}