蝶威杯2026年高频因子大赛
比赛时间: -
量化洞察先机,因子决胜高频(Quantitative Insights Seize Opportunities. Factors Dominate High Frequency)
主办方:蝶威资产
比赛介绍
## **赛事介绍**
在现代量化投资领域,阿尔法因子(Alpha Factor)是获取超额收益的核心。一个有效的因子,能够从海量、嘈杂的市场数据中精准地预测未来股价的动向。对于浙江蝶威资产管理有限公司这样的私募资产管理机构而言,持续不断地挖掘、迭代高质量的因子,是保持投资策略领先地位的关键。
浙江蝶威资产管理有限公司成立于2018年4月,是一家以人工智能量化投资策略为主的私募资产管理机构。公司致力于探索数学科学、人工智能与投资实践、投资逻辑的完美结合,凭借核心成员的长期证券投资经验和量化投资经验,依托先进的大数据分析和数学建模技术,在各类金融产品上进行高中低频策略和套利策略的研发,力求在不同周期、不同市场环境下都带来可观且比较稳定的投资回报。“蝶威”之名,源自蝴蝶效应——金融市场作为典型的复杂动态系统,初始条件的微小变化可能引发长期且巨大的链式反应,我们始终坚持深入研究、科学应对这种市场威力;英文名DeepWin既是“蝶威”的谐音,更衍生于DeepMind,隐喻我们将人工智能技术深度应用于金融市场与量化投资领域的核心追求。
我们相信,最卓越的投资思想往往源于开放的探索与协作。因此,我们选择通过本次挑战赛,开放真实的、高颗粒度的市场数据,邀请全球顶尖高校的人才与我们共同迎接这一挑战。
在本次比赛中,您将有机会接触到稀缺、高质量的A股市场分钟级行情数据。您的任务是利用这些数据,构建一个能够预测未来股票收益的创新因子。您的因子模型将在两个阶段进行评估:首先是在历史数据上进行回测的“公榜”得分,然后是在全新的、动态更新的市场数据上进行模拟的“私榜”得分,以确保您的策略在真实世界中的稳健性。
通过本次竞赛,您将获得处理大规模金融时序数据的宝贵实战经验,深入理解市场微观结构,并直面顶尖量化私募在日常研究中遇到的真实挑战,尤其是如何以AI技术驱动因子挖掘、适配高中低频多策略场景的核心命题。我们期待看到参赛者们应用创新的方法,解决这个充满挑战且激动人心的量化投资难题。
**入门指南**
为了帮助参赛者更好地准备,我们与合作的线上量化平台共同准备了一系列入门资源:
1. **技术工作坊**:由平台方工程师主讲,详细介绍平台功能、API使用、数据结构及适配AI量化的因子分析框架,贴合蝶威高中低频策略与套利策略的研发逻辑。
2. **模版代码**:我们将提供一个包含数据读取、因子构建范例(和评估流程的核心代码Notebook,帮助您快速上手,适配AI模型训练与因子有效性验证需求。
3. **线上答疑会**:我们将在赛程中安排资深投研专家进行线上讲座与答疑,分享AI量化前沿动态、蝶威在多策略因子研发中的实践经验,以及应对市场蝴蝶效应的模型优化思路。
## **数据说明**
本次竞赛提供高质量的A股市场历史行情数据,具体如下:
* **股票池**: 沪深300指数在历史相应时间点上的成分股。
* **时间范围**: 2023-01-01至2024-12-31。
* **数据频率**: snapshot 快照数据。
* **数据内容**: 包含当前snaspshot的价格、成交量、成交额,以及盘口10档的委托量、委托量、委托笔数等字段。
## **模版代码**
本次竞赛采用”**高频因子低频化**”的方式,平台提供高频数据,参赛者构建日频因子并提交。主办方将提供如下多个模版代码供参赛者参考:
* 用SQL计算vwap因子,参考 demo_sql.ipynb。
* 用python计算vwap因子,参考 demo_spread.ipynb。
* 利用机器学习算法构建AI因子,参考 demo_ai.ipynb。
## **赛程安排**
### **阶段一:报名**
* **时间周期**:2026-01-12 至 2026-01-31
* **宣讲会**:2026-01-23 在量化峰会上进行宣传。
* **报名和组队**:通过活动主页进行报名,或联系兴趣团老师。可单人或多人组队(单一队伍最多不超过3人)。报名完成后可加入官方社群(微信/QQ群)寻找队友。报名截止时间为“**2026-01-31**”。
### **阶段二:初赛**
* **时间周期**:2026-01-26 至 2026-02-20
* **运行机制**:
* 以**2026-02-16 00:00:00**作为**截止日期**。
* 在截止日期前,参赛队伍可利用平台提供的数据开发因子并按照规范提交代码,平台会使用验证集数据构建对应的因子数据并打分实时更新排名,以队伍最好的一次得分进行展示在”公榜(Public Leaderboard)”上;同时,参赛队伍可以选择和替换总计不超过10个因子作为截止日后的候选因子。
* 在截止日期后,参赛者将不允许修改候选因子的构建代码;平台在2026年2月16日至2026年2月20日期间的每个交易日盘后,会根据参赛者提供的代码增量构建因子数据,每日计算得分排名,并以队伍最好的一次得分进行展示在”私榜(Private Leaderboard)”上。
* **线上技术工作坊**:由合作平台方工程师主讲,详细介绍平台功能、API使用、数据结构及因子分析框架。
* **账号与数据发放**:向所有成功报名的队伍发放比赛专用账号,开放数据访问权限。
* **验证集数据**:选择**2025-01-01至2025-08-30 中部分交易日的snapshot数据**作为验证集数据。
* **每周答疑会**:赛程中每周会安排一至两场线上Q&A,解答选手在研究中遇到的共性问题。
### **阶段三:决赛**
* **时间**:2026-02-21 至 2026-03-01
* **决赛名单公布**:组委会根据私榜阶段最终得分和排名,公布15支入围决赛的队伍名单。
* **决赛辅导**:为每支决赛队伍提供一次30分钟的线上辅导,帮助其深化研究报告。
* **提交材料**: 参赛队伍需提供以下材料:
* 因子研究报告 (.pdf, 10-15页):一份结构完整、论证严谨的深度报告,建议包含以下章节:
* 摘要 (Abstract)
* 引言 (Introduction):因子研究背景与文献综述。
* 因子构建 (Factor Construction):详细阐述数据预处理、因子计算公式与逻辑。
* 实证分析 (Empirical Analysis):全面的因子分析回测结果展示、绩效归因分析、稳健性检验(如不同市场周期、不同行业下的表现)。
* 创新性与局限性讨论 (Innovation and Limitations)。
* 结论 (Conclusion)。
### **阶段四:颁奖**
- **时间**:2026年3月初
- **决赛答辩会**: 采用“10分钟展示 + 5分钟评委问答”的形式。线下举行,并同步线上直播。
- **颁奖典礼**: 答辩结束后,现场公布最终名次,并举行隆重的颁奖典礼,邀请所有嘉宾、评委与选手共同参与。
## **评估系统**
本次竞赛在公榜(Public Leaderboard)与私榜(Private Leaderboard)阶段的排名,将完全依据以下量化评估流程和指标确定。
### **数据检测**
提交的因子数据必须通过以下所有检测,否则视为无效提交。
* **数据列检查**:
* 提交的文件必须且仅包含三列:`date`(交易日)、`instrument`(股票代码)、`factor`(因子值)。
* **请注意:平台不限制因子方向,默认因子值越大越好。参赛者需自行确保因子方向的逻辑正确性**。
* **交易日完整性检查**:因子数据不得缺失评估时间范围内的任何一个交易日。
* **因子覆盖度检查**:在每个交易日,因子值的缺失率不得高于 **40%**。
### **数据处理**
通过数据检测后,系统将将您的原始因子与 BARRA 风险因子、本地因子库进行回归,并取残差作为新的因子,以评估该因子的增量影响。
### **计算得分**
系统将基于处理后的因子值,分别进行**单因子分析**和**单因子回测**,并综合计算最终得分。
**最终得分公式如下:**
$$
\text{FinalScore} = 0.5 \times \text{Rank}_{\text{fa}} + 0.5 \times \text{Rank}_{\text{bt}}
$$
其中:
* $\text{Rank}_{\text{fa}}$ 为单因子分析得分的排名。
* $\text{Rank}_{\text{bt}}$ 为单因子回测得分的排名。
#### **单因子分析得分**
该得分由以下四个指标的**排名**加权计算得出:
$$
\text{Score}_{\text{fa}} = 0.4 \times \text{Rank}_{\text{IC均值}} + 0.3 \times \text{Rank}_{\text{ICIR}} + 0.2 \times \text{Rank}_{\text{夏普比率}} + 0.1 \times \text{Rank}_{\text{换手率}}
$$
其中:
* $\text{Rank}$ 为指标在截面上的排名。
* $\text{IC均值}$ 为因子值与下期收益率的相关性的均值,不加绝对值。
* $\text{ICIR}$ 为IC时序序列的IR值。
* $\text{夏普比率}$ 为分组回测中多空组合的夏普比率。
* $\text{换手率}$ 为分组回测中多空组合的换手率,即多头组合和空头组合的换手率均值。
#### **单因子回测得分**
系统将基于处理后的因子值进行每日调仓的回测,以检验因子的实际选股能力。
* **回测周期**:2023年1月1日 至 2024年12月31日
* **调仓周期**:每日
* **初始资金**:10,000,000 元
* **买卖价格**:次日VWAP(成交量加权平均价格)成交
* **手续费**:双边 0.05%(5 bps),不考虑其他税费
* **选股逻辑**:每日选择因子值最大的60只股票,进行等权重配置并换仓。
* **资金再平衡**:在换仓日对持仓股的权重进行再平衡。
该得分由以下两个指标的**排名**加权计算得出:
$$
\text{Score}_{\text{bt}} = 0.6 \times \text{Rank}_{\text{超额夏普}} + 0.4 \times \text{Rank}_{\text{最大回撤}}
$$
其中:
* $\text{超额夏普}$ 为投资组合相较于沪深300指数的超额夏普。
* $\text{最大回撤}$ 为投资组合的最大回测。
### **决赛评估**
入围决赛的队伍将由评审委员会进行综合评估,评分标准如下:
* **因子质量与创新性 (40%)**:
* 逻辑性与原创性 (20%): 因子背后的经济学逻辑或市场微观结构解释是否清晰、合理、有创新。
* 有效性与稳健性 (20%): 因子在不同市场周期、不同行业下的表现是否稳定。
* **研究深度与规范性 (30%)**:
* 研究报告质量 (20%): 报告结构是否严谨、分析是否深入、论证是否充分。
* 代码质量 (10%): 代码是否规范、可读性强、易于复现。
* **现场表现 (30%)**:
* 陈述表达 (15%): 对研究工作的理解是否深刻,表达是否清晰、有条理。
* 问答互动 (15%): 回答评委提问是否精准、有逻辑。
## **提交文件**
在本次比赛中,您只需要按照**模版代码**里的例子,将因子构建代码写在**main**函数中并提交,平台会自动运行生成因子数据,计算得分并实时公布。但需要注意,要保证**main**函数的返回数据格式应遵循特定格式,比如:
| date | instrument | factor |
|------------|------------|-------|
| 2023-01-03 | 000001.SZ | 0.05 |
| 2023-01-03 | 000002.SZ | -0.12 |
| ... | ... | ... |
## **赛事奖励**
* **奖金**:???
* **Offer**:???
## **代码要求**
本次竞赛为代码竞赛,所有提交必须通过合作的线上量化平台完成。为保证竞赛公平性,您的代码需满足以下条件:
* **平台提交**: 所有因子生成代码必须在指定的线上平台Notebook环境中运行并提交。
* **运行时长限制**: CPU Notebook \<= 9 小时。
* **禁止访问外部网络**: 为防止信息泄露和使用未来数据,Notebook的互联网访问权限将被禁用。
* **外部数据**: 禁止使用未经官方许可的任何外部数据。
* **最终提交**: 您提交的必须是可以自动运行并生成因子文件的代码,而非因子数据文件本身。
## **竞赛规则**
* **团队规模**: 每支队伍人数为1-3人,每位选手只能加入一支队伍。
* **知识产权**: 参赛作品(代码、报告等)的知识产权归参赛队伍所有。主办方对所有作品拥有非商业性的评审、展示和宣传权利。对于获奖的优秀因子,主办方在同等条件下拥有优先的商业合作洽谈权。
* **诚信竞赛**: 严禁任何形式的抄袭、作弊或共享代码行为。一经发现,将立即取消该队伍的参赛资格。
* **最终解释权**: 本赛事所有规则的最终解释权归进益资本大赛组委会所有。
## **竞赛支持**
* **官方交流社群**:建立赛事官方微信/QQ群,用于日常通知发布、技术问题解答和选手间交流。
* **FAQ文档**:在官网建立持续更新的“常见问题解答”页面。
* **学术资源**:提供经典的因子研究论文列表,供选手参考。
奖金&奖项
¥10000

