暗流涌动:方正证券量化选股因子,如何从日内数据挖掘“平衡的独特性”?
20250827-方正证券-多因子选股系列研究之二十三:个股日内成交量分布特征与日内流动性弹性刻画本报告详细介绍了方正证券研究所最新构建的“暗流涌动”多因子选股模型。该模型核心基于个股日内成交量分布特征和日内流动性弹性,旨在捕捉与市场不同步但偏离不大的股票以及在成交量激增时具有适当流动性缓冲的股票,以获取超额收益。报告指出,在当前市场活跃、小市值和量价类因子表现出色的背景下,方正金工高频因子低频化系列因子整体表现突出。其中,“综合量价”因子表现尤为出色,年初以来多头组合超额收益约为11.44%。“暗流涌动”因子通过“成交量分布熵值”和“日内流动性弹性”两个子因子等权合成。“成交量分布熵值”通过香农熵刻画个股日内相对成交量的分布特异性,旨在识别信息驱动的交易;“日内流动性弹性”则衡量个股在成交量突变时的价格灵敏程度。回测结果显示,“暗流涌动”因子表现出色,在月度频率上的选股效果显著:Rank IC均值为-7.65%,Rank ICIR为-4.44,多空组合年化收益率为29.17%,信息比率为3.49。该因子与其他现有量价因子相关性较低,具有明显的增量信息。将“暗流涌动”因子与其他14个量价因子(包括“适度冒险”、“完整潮汐”等)正交化后等权合成为“综合量价”因子,其表现大幅提升:Rank IC均值-12.10%,Rank ICIR -4.95,多空组合年化收益率47.37%,信息比4.16,月度胜率84.25%。即便在剔除常见风格因子影响后,“综合量价”因子仍非常有效。在不同样本空间下,“暗流涌动”和“综合量价”因子均表现良好,尤其在中证1000成分股中表现更为强势。通过指数增强模型验证,“综合量价”因子在沪深300、中证500、中证1000指数增强中均能带来可观的年化超额收益。风险提示: 本报告基于历史数据分析,历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。核心主题与重要事实1. 市场背景与现有因子表现 市场活跃度: “今年以来市场成交活跃,小市值+量价类因子表现出色,方正金工高频因子低频化系列因子整体表现较为出色。” “适度冒险”因子: 截至2025年7月31日,该因子多空收益为20.56%,表现最为出色。 “综合量价”因子: “合成的‘综合量价’因子多空收益为 23.31%。” 且“年初以来十分组多头超额约为 11.44%。” 成交量核心因子特性: “以成交量为核心的因子, 整体表现可能不是最出色的, 但其相关性要明显低于以收益率为核心的因子。”2. “暗流涌动”因子的构建逻辑与表现 构建目的: 旨在捕捉“那些与市场不同步, 但同时偏离不太大的股票更容易获得超额收益”和“当个股成交量突然放大时, 那些具备适当流动性缓冲的股票, 更容易获取超额收益”。 构成要素: 由“成交量分布熵值”因子和“日内流动性弹性”因子等权合成。2.1 “成交量分布熵值”因子 理论基础: 个股日内交易量分布特征隐含交易信息。全市场股票日内成交量分布呈U型结构,但具体个股因其交易群体、基本面/技术面信息、盘中突发信息等不同而存在差异性。 核心思想: 通过香农熵(Shannon Entropy)刻画日内相对成交量分布的特异性。 “当熵值越大时,表明个股日内相对交易量的分布越趋于均匀分布……此时熵值越大实际表达的是个股的成交量越接近于市场整体的成交分布特征。” “当熵值越小时,表明个股日内相对交易量的分布越集中或越不均匀,此时该股票的交易越有可能由信息驱动。” 优化处理: 因子值进行均值距离化处理(减去截面均值取绝对值),因为“适当合理的熵值可能更佳”,即偏离市场太远或太近的股票表现都不理想。 表现: Rank IC均值为-5.72%,Rank ICIR为-3.54,多空组合年化收益率为23.14%,信息比率为2.74。2.2 “日内流动性弹性”因子 关注点: “反应了个股在日内交易时的价格灵敏程度,区别于传统非流动性因子等定义,我们更关注在日内出现成交量突变(成交量激增)时的价格灵敏程度。” 构建步骤概要:筛选“激增时刻”(每分钟成交量相较过去5分钟均量超过1倍)和“普通时刻”。 计算每分钟价格波动幅度((最高价-最低价)/开盘价)。 计算“激增时刻”和“普通时刻”的价格波动幅度均值。 计算价格敏感系数(“激增时刻”均值/“普通时刻”均值),价格弹性系数 = 1 - 价格敏感系数。 对价格弹性系数进行横截面“均值距离化”处理。 低频化处理得到“月均流动性弹性”和“月稳流动性弹性”,等权合成。 核心逻辑: “弹性系数较大的股票,可以理解为流动性相对较好,对短期交易放量的反应相对较小,弹性系数较小的票,流动性相对较弱,对短期交易量的冲击反应较大。” 同样,适当的流动性弹性更佳。 表现: Rank IC均值为-7.14%,Rank ICIR为-4.18,多空组合年化收益率为29.49%,信息比率为4.36。2.3 “暗流涌动”因子整体表现 合成表现: Rank IC均值为-7.65%,Rank ICIR为-4.44,多空组合年化收益率为29.17%,信息比率为3.49。 分年度表现: 2025年截至7月底,多头组合上涨31.85%,空头组合上涨9.76%,多空组合相对收益为22.10%。 行业覆盖: “在各一级行业内表现普遍较好,绝大多数行业 Rank IC 均值超过 -7%。” 与其他风格因子相关性: “暗流涌动”因子整体与其他风格因子相关性较低,仅与波动率因子相关性超过20%(22.84%)。 剥离风格因子影响: 剔除常用风格因子影响后,仍具有不错的选股能力:Rank IC均值为-4.38%,Rank ICIR为-3.14,多空组合年化收益率为20.45%,信息比率2.99。 不同样本空间表现: 在中证1000指数成分股内表现强势(Rank IC均值-7.76%,多空组合年化收益26.03%),在沪深300、中证500指数成分内也表现较好。3. “暗流涌动”因子对“综合量价”因子的增量贡献 高频因子低频化系列: 此前已构建14个量价因子(如“适度冒险”、“完整潮汐”等),所有因子Rank ICIR绝对值均在3.5以上。 因子相关性: “暗流涌动”因子与“适度冒险”和“云开雾散”因子相关性较高(分别为56.11%和48.09%),与其余因子相关性相对较小,“暗流涌动”因子与其余14个因子的平均相关系数为33.47%,表明其具有一定的独特性和增量信息。 合成后表现提升: 将15个因子(14个原有因子 + “暗流涌动”因子)正交化后等权合成为“综合量价”因子,表现大幅提升: Rank IC均值:-12.10% Rank ICIR:-4.95 多空组合年化收益率:47.37% 信息比:4.16 月度胜率:84.25% 增量贡献明显: “虽然‘暗流涌动’因子权重相对较低, 但相较于不含‘暗流涌动’因子的综合量价而言,加入‘暗流涌动’因子后的增量信息依然较为明显,其 Rank ICIR、多空组合年化收益率、年化波动率、信息比率以及最大回撤等指标,均有较为明显的提升。” 剥离风格因子后的“纯净综合量价”: Rank IC均值-7.04%,Rank ICIR -3.63,多空组合年化收益率28.10%,信息比2.97,月度胜率79.53%,依然非常有效。 不同指数增强表现: “综合量价”因子在沪深300、中证500、中证1000指数增强中均表现较好,年化超额收益分别为8.57%、11.12%、16.92%。4. 风险提示 “本报告基于历史数据分析, 历史规律未来可能存在失效的风险;市场可能发生超预期变化;各驱动因子受环境影响可能存在阶段性失效的风险。”总结方正证券研究所通过深入研究个股日内成交量分布特征和流动性弹性,成功构建了新的“暗流涌动”因子。该因子不仅自身表现出色,并且由于其较低的与其他量价因子的相关性,为已有的“高频因子低频化”系列提供了显著的增量信息。将“暗流涌动”因子纳入“综合量价”因子后,整体选股能力大幅提升,尤其在中小盘股票(中证1000成分股)中展现出更强的优势。通过严格的指数增强回测,也验证了其在实际投资中的有效性。该研究为投资者提供了新的视角和工具,以期在活跃的市场中获取更稳定的超额收益。然而,投资决策仍需警惕历史数据失效和市场超预期变化的风险。