精华帖子

解读采访之衍复投资:量化不可能三角、策略容量评估与个人量化的优势

由bqu1vdra创建,最终由bqu1vdra 被浏览 9 用户

公司命名由来

search,意为搜寻。在search前加上前缀“re”,即表示反复、重复搜寻。research这个词由此而来。这种构词法既显示了语言的魅力,更体现了研究工作的本色。不断寻找答案,在反复搜寻中接近真相。反反复复地计算、推衍,中文中也有类似的一个词,是为“衍复”。这就是衍复投资命名的由来。意喻着持续、往复地钻研、琢磨,以实现量化策略的精进。

高亢简介

2019年8月,高亢创设了衍复投资;2020年10月,成立仅一年有余,衍复便快速崛起,跻身百亿级量化私募之列,如今衍复已经晋升为四大天王之一,其发展之势引人感叹。

衍复的创始人高亢,高中时获得过国际物理奥林匹克竞赛金牌,本科就读于北京大学物理系,后转学至美国麻省理工学院,获得物理、计算机双学士学位。2009年从美国麻省理工学院物理系毕业后,他并未选择在物理领域深造,而是将量化投资作为自己新的研究方向。

高亢曾就职于芝加哥知名自营交易公司DRW Trading的高频交易组,之后又到了Two Sigma Investments的亚洲投资组合管理组,直到2014年离职。

这一路辉煌的履历,不就是传说中的量化天才嘛。

今天,我们将从2020年、2023年以及2025三篇关于衍复投资的公开报道中探讨,量化不可能三角策略容量评估、大资金的限制以及个人量化的优势。

量化不可能三角

2020年,好买基金曾对话高亢。在访谈中,主持人问了这样一个问题:

2019年、2020年量化私募的管理规模增长很快,您如何看待中国量化行业的发展方向,像策略迭代的方向、行业格局的变化?

高亢回答到:在中国市场,头部机构能够获得非常高的超额收益,这一现象表明中国的量化行业还处于早期成长阶段。随着量化总体量的不断增长,未来超额收益必然会逐渐回归到一个合理的范围,而量化策略也会成为主流的投资品类。在这个过程中,能够不断迭代策略,在投研体系上具有长期竞争力的公司会逐渐胜出。未来3~5年,也许千亿量化私募会像今天的百亿量化私募一样成为常态。

这段对话中,我的关注点在于「百亿规模」到「千亿规模」的跃升。由此,我自然而然地想到了量化投资中经常被讨论的量化不可能三角的问题。

量化行业的“不可能三角”指的是规模、业绩和回撤这三者无法同时兼得的铁律。

这是一个行业固有的物理矛盾,其核心在于策略类型与市场流动性的制约。高频策略虽然能做到高业绩和低波动,但受限于市场微观流动性,其资金规模注定有限;低频策略虽然逻辑深厚,能容纳更大规模的资金,但由于交易频率低、持仓周期长,必须忍受市场周期的颠簸,因此收益率较低且波动更大。所以,任何量化管理人在扩大规模的过程中,都必须在收益和稳定性之间做出取舍。

高亢表示,过去短周期的收益率太高了,使长周期策略没有竞争力。随着市场有效性提高,过去几年短周期收益率明显下降,长周期策略的竞争力在逐步提高,这会导致市场资金容量的提高。

一方面,他们希望建立一个长期存续的资管品牌,所以需要策略体系更稳定,能容纳更大体量的长期资金。中低频的策略在这方面更有优势,涉及的领域更多、面更广,策略容量也更大。

另一方面,他个人更喜欢研究中低频的策略,这类策略需要运用更多的经济学逻辑,更依赖思考与创造,这与高频策略不同。很多高频策略的研究是数据驱动的,并不需要经济学方面的理论基础。但他们同样看重高频策略的研发,投入了大量资源和人力。因为高频策略的加入可以让超额收益更加平稳,对公司的长期发展也很有益处。

如何评估策略规模

在23年的9月的一场路演中,也有人问了高亢类似的问题,他的问题是这样的:我们常提到管理规模,超额波动率和超额收益是不可能三角,很多投资者担心衍复现在的管理规模是否过大?是否会影响到后面的超额收益?

高亢回答,他们在23年400亿的规模体量之下运作是有历史数据的支撑,虽然整个产品可能会有回撤,但超额收益也是有目共睹的。并且,他们的策略容量,各个产品线加起来可以做到千亿以上,但是当时他们的存量规模不到500亿,所以它离上限还有非常大的空间。

在这个回答中,我又捕捉到了“上限”这个关键词。上限意味着策略规模的有限,那么我们该如何去评估一个策略的上限或者说容量是多少呢?

23年3月的一场路演中,也有人抛出了类似的问题,不过他的问题更加具体,他问:衍复的小市值指增这个策略预计容量大概是多少?高亢答:这个策略容量大概是200亿。

接着,提问者继续深挖,问:200亿策略容量怎么来的?

高亢说,200亿的策略总量是通过「回测」去测算的。他们做回测的时候就是在不同的规模下去做回测,然后随着规模的提升,它的超额收益会下降。然后他们选200亿的测试容量,是因为在200亿的规模下,这个策略它相较于500、 1000还会具有一个比较明显的优势。

所以,高亢已经给出了我们答案,他们对于策略容量的评估是通过回测实现的。通过回测来实现策略容量的评估,看起来很容易理解,但这里面的技术细节其实还不少。只有理解这些技术细节,才能正确地评估回测结果与策略容量的关系。今天和大家详细地说道说道。

当策略发出买入信号时,一般会明确告诉你目标买入价;如果没特别标注,那信号触发瞬间的市场价格,就是默认的买入价。这时你可以下固定价格委买单,但要注意两个问题:要么市场上实时挂单不够,虽然策略发出了信号,但是根本就买不到;要么是买到的数量太少,达不到策略要求的仓位。

而我们常说的策略有效容量,核心定义其实是 —— 在目标价和你能接受的额外成本(也就是滑点)范围内,能稳定买到足额筹码的最大资金量,这个就是策略有效容量。

如果策略预估的收益空间比较大,但当前目标价上能买到的筹码有限,没法满足仓位需求,就可以主动承担一点滑点来提高成交概率。简单说,滑点就是为了能买够需要的股票,而不得不比目标价多花的钱。

实操中,提高价格的委托方式有两种,各有好坏:

继续用「固定价格委托」:手动设一个比目标价高的委托价,比如目标价 9.3 元,就那么你的委托价可以设置为 9.32。这种方式的好处是滑点上限能完全控制(最多多花 0.02 元),但缺点是依然可能只买到一部分,甚至完全没成交;

用「市价委托」:不设固定价格,直接以市场当前最优的卖价成交,这种方式呢几乎能保证买够需要的筹码。但问题在于,滑点成本会跟随着资金量变大而增加 —— 资金越多,需要吃掉的卖盘挂单就越多,从最靠前的委卖一,可能要吃到委卖二、委卖三,极端情况甚至能吃到涨停价,多花的钱也就越多。

以上的这些讨论都是基于「价格能不能对上」的问题,但回测时还有个关键要点,就是「成交量能不能匹配」。这直接影响回测结果和实盘表现的差距,尤其是对中低频策略估算容量时特别重要。

同样地,我们也可以举一个例子来理解:

假设有 100 万元资金,策略触发买入信号后,计划以 9.3 元的价格建仓 25 万元(也就是 1/4 仓位)。通过回测我们可以反推:在 9.3 元及可接受的滑点范围内,到底能买到多少筹码?但日线数据只有这些信息:开盘价 9.3 元、最高价 9.4 元、最低价 9.25 元、收盘价 9.3 元,以及当日总成交量 20 万元。它没有分时成交分布、盘口挂单这些细节,根本没法精准知道 9.3 元这个价位当时到底能买多少。

所以,为了弥补这个信息缺口,日线回测会用一种「价格区间成交量分摊」的假设方法。

首先,先定有效价格区间:目标价9.3元在当天9.25-9.4元的价格范围内,如果不想承担滑点,有效区间就是「9.25 元(最低价)-9.3 元(目标价)」,这个区间占当天总价格跨度(9.4-9.25=0.15 元)的 1/3;

此时,我们假设成交量均匀分布,也就是默认当天的成交量是平均分散在 9.25-9.4 元整个价格区间里的,那有效区间内的可交易成交量,就是当天总成交量乘以有效区间占比:20 万元 ×1/3≈6.67 万元。

在不承担滑点的情况下,策略只能在 9.3 元及以下买到 6.67 万元,离 25 万元的目标仓位差很多;如果想买够 25 万元,就需要扩大有效价格区间,再重新计算这个新区间里能买到的成交量。

这种「均匀分布假设」是日线数据局限性下的折中方案,也是 backtrader 这种开源回测框架中使用的算法。解释了这个例子,我想你应该知道了算法的局限了。

实际市场中,成交量并非是均匀分布的,它可能集中在开盘、收盘或某一价格节点。因此通过这个方式回测估算的容量与实盘真实容量仍存在偏差。

这种偏差如何去缩小呢?此时就需要有更高频的数据源来进行成交量的匹配了。

假设我们有分钟级的数据源,那么在回测时,进行成交匹配时,我们就可以用每分钟的成交额和收盘价来进行匹配。如果该分钟的收盘价满足目标价,我们就把该分钟的成交额匹配给策略。这种情况下,固然还存在一些误差,因为分钟的成交均价并不一定等于该分钟的收盘价,但是与日线相比,这个误差已经小很多了。

当然更精确的就是使用tick级的数据进行匹配了。因为tick数据就只有成交价和成交量,所以,只要价格能匹配,该tick的成交量就能都匹配给策略,此时成交量的算法就是精确的。

那是不是说,有了 tick 级的数据,策略的容量估算就是绝对正确的了呢?

当然不是。试想,市场上一定只有我们一家的策略在运行吗?其它策略不需要匹配成交量吗?之前的算法,是假设这些成交量可以完全匹配给某一策略,但是,这个假设并不能站住脚。

另一方面,无论是分钟线还是 tick 级的数据,它都是历史上已经成交的数据。但是,在实盘中,撮合是你的报价与买卖5档的委托价之间的撮合。有可能买卖5档上有很大的委托量,但实际成交却只有廖廖几手,所以,在这种情况下,策略的容量实际上就被历史成交数据不合理地限制住了。

所以,策略容量的估算确实是一个很复杂的问题。既然很复杂,那是否存在简单的解决方案呢?

其实是有的。你看,滑点本质上是因为交易对市场的冲击造成的。资金量越大,冲击越大。所以,如果你给到策略的资金量很少,那么对市场就没有冲击,你的策略就几乎一定能在发出信号时,以你指定的价格成交。

回测本就是量化交易的核心根基,倘若回测的优异表现无法在实盘里复刻,量化交易的本质意义也就不复存在了。也正因如此,小资金、小团队在量化交易中的这份优势显得尤为珍贵。

透过上述的分析不难发现,在量化交易中,资金规模似乎并非越大越好。大资金在实际交易中,反而更容易被滑点牵绊、受市场冲击影响;反观小资金,却能凭借灵活的操作特点,避开这些规模带来的掣肘,这也让个人和小团队在量化领域拥有了自己的立足之地。

衍复需要什么人才

最后,我们再来聊聊头部量化机构衍复的人才需求方向。2020 年衍复创始人高亢与好买基金的对谈中,曾明确提到,公司招聘核心考察两大方面。

第一是兴趣,这也是招聘中最看重的一点:重点关注面试者的核心兴趣点,看他是真正对量化研究本身充满热情,还是更看重物质回报。因为对研究的兴趣所能带来的动力,是长期且根本的;而单纯由物质驱动的人,往往容易在发展中迷失方向,无法将精力聚焦在研究工作上。从长期来看,能在策略研发领域持续做出贡献的人,必然是对研究抱有浓厚兴趣、能够沉下心长期深耕的人,这也是衍复招人的首要标准。

第二是能力,公司会重点考察面试者是否具备扎实的数理背景,个人专业能力是否达到岗位要求,能否真正为公司的量化投研工作创造价值、做出贡献。如果大家有意向加入衍复,不妨对照这两大标准梳理自身情况,看看是否契合其招聘要求。

标签

量化投资
{link}