Lopez de Prado 框架:金融机器学习的最新进展
1. 概念:超越预测(元标签 Meta-Labeling)
传统的金融机器学习 (ML) 通常侧重于“原始标签”(Primary Labeling)——预测原始价格的涨跌方向。Lopez de Prado 认为,由于价格序列中的信噪比极低,这本质上是困难的。
他的核心理念将重点转移到“元标签”(Meta-Labeling):即不使用 ML 来预测原始方向,而是用来决定何时执行由简单、非 ML 策略产生的交易。机器的工作是过滤掉基础策略中的错误信号(误报),从而最大限度地提高准确性并减少交易成本。
2. 核心逻辑:传统金融机器学习的缺陷
LdPd 指出标准 ML 应用于金融领域的三个主要系统性缺陷:
A. 数据泄露和观测重叠
当我们根据一段时间内的收益(例如 5 天)对数据进行标记时,连续的观测值在时间上往往会重叠,导致交叉验证期间出现严重的数据泄露。这使得回测结果看起来虚假地盈利(过度拟合)。
B. 非平稳性
金融时间序列是非平稳的(它们的统计特性随时间变化)。标准 ML 算法假设平稳性。应用差分处理来实现平稳性通常会丢弃有关序列持久性的关键信息(记忆)。
C. 错误的衡量指标(夏普比率陷阱)
夏普比率 (Sharpe Ratio) 是一种常见的优化目标,但它假设收益呈正态分布且相互独立。LdPd 提倡针对特定经济目标定制优化指标,并使用像分层风险平价(HRP)这样的稳健方法进行投资组合分配,该方法不需要估计逆协方差矩阵。
3. 策略:确保稳健性的三大核心技术
为了构建可投入生产的 ML 模型,LdPd 提出了解决上述缺陷的基础技术:
规则 1:净化与分块 K-Fold 交叉验证 (Purged and Blocked CV)
应用:防止先见偏差和数据泄露。与标准 K-Fold CV 不同,我们“净化”(移除)在时间上与训练样本重叠的测试样本,尤其是在策略的平仓障碍周围,确保时间上的分离。“分块”则确保使用连续的时间段,尊重时间序列的结构。
规则 2:分数微分(FDS)用于特征工程
应用:在保留记忆的同时实现平稳性。FDS 不使用整数差分(d=1,损失所有记忆),而是找到使序列达到平稳性所需的最小分数微分参数(0 < d < 1)。这使得特征保持平稳(利于 ML),同时仍具有高度预测性(保留长期记忆)。
规则 3:元标签(Meta-Labeling)用于策略优化
应用:最大化现有投资假设的效率。ML 模型被训练来预测现有策略的预测是否正确,而不是预测市场本身的走势。这显著提高了信噪比,并将 ML 的努力集中在优化交易的精度上(减少误报)。
4. 风险和局限性(模型何时失效)
LdPd 框架显著提高了模型的稳健性,但并非万无一失。模型失效通常发生在以下情况:
A. 结构性机制转变
尽管 FDS 有助于处理普通的非平稳性,但深层的结构性机制转变(例如,意料之外的全球金融危机、重大监管改革)可能会从根本上改变模型所学习到的因果关系。当发生此类断裂时,必须重新训练或调整模型。
B. 数据稀缺性
元标签需要大量的“原始”策略交易来为 ML 模型生成足够的标签。交易频率极低的策略可能无法产生足够的数据点来训练稳健的 ML 分类器,从而导致高方差和过度拟合。
C. 糟糕的原始策略
元标签只能优化现有策略。如果初始原始策略根本没有预测能力(例如,纯粹的噪声),元标签无法从无中创造信号。基础假设必须包含某种经济因果关系。