Alpha 学院

Lopez de Prado 框架：金融机器学习的最新进展

📅 Last Updated: 2026-01-04

1. 概念：超越预测（元标签 Meta-Labeling）

传统的金融机器学习 (ML) 通常侧重于“原始标签”（Primary Labeling）——预测原始价格的涨跌方向。Lopez de Prado 认为，由于价格序列中的信噪比极低，这本质上是困难的。

他的核心理念将重点转移到“元标签”（Meta-Labeling）：即不使用 ML 来预测原始方向，而是用来决定何时执行由简单、非 ML 策略产生的交易。机器的工作是过滤掉基础策略中的错误信号（误报），从而最大限度地提高准确性并减少交易成本。

LdPd 指出标准 ML 应用于金融领域的三个主要系统性缺陷：

当我们根据一段时间内的收益（例如 5 天）对数据进行标记时，连续的观测值在时间上往往会重叠，导致交叉验证期间出现严重的数据泄露。这使得回测结果看起来虚假地盈利（过度拟合）。

金融时间序列是非平稳的（它们的统计特性随时间变化）。标准 ML 算法假设平稳性。应用差分处理来实现平稳性通常会丢弃有关序列持久性的关键信息（记忆）。

夏普比率 (Sharpe Ratio) 是一种常见的优化目标，但它假设收益呈正态分布且相互独立。LdPd 提倡针对特定经济目标定制优化指标，并使用像分层风险平价（HRP）这样的稳健方法进行投资组合分配，该方法不需要估计逆协方差矩阵。

为了构建可投入生产的 ML 模型，LdPd 提出了解决上述缺陷的基础技术：

应用：防止先见偏差和数据泄露。与标准 K-Fold CV 不同，我们“净化”（移除）在时间上与训练样本重叠的测试样本，尤其是在策略的平仓障碍周围，确保时间上的分离。“分块”则确保使用连续的时间段，尊重时间序列的结构。

应用：在保留记忆的同时实现平稳性。FDS 不使用整数差分（d=1，损失所有记忆），而是找到使序列达到平稳性所需的最小分数微分参数（0 < d < 1）。这使得特征保持平稳（利于 ML），同时仍具有高度预测性（保留长期记忆）。

应用：最大化现有投资假设的效率。ML 模型被训练来预测现有策略的预测是否正确，而不是预测市场本身的走势。这显著提高了信噪比，并将 ML 的努力集中在优化交易的精度上（减少误报）。

LdPd 框架显著提高了模型的稳健性，但并非万无一失。模型失效通常发生在以下情况：

尽管 FDS 有助于处理普通的非平稳性，但深层的结构性机制转变（例如，意料之外的全球金融危机、重大监管改革）可能会从根本上改变模型所学习到的因果关系。当发生此类断裂时，必须重新训练或调整模型。

元标签需要大量的“原始”策略交易来为 ML 模型生成足够的标签。交易频率极低的策略可能无法产生足够的数据点来训练稳健的 ML 分类器，从而导致高方差和过度拟合。

元标签只能优化现有策略。如果初始原始策略根本没有预测能力（例如，纯粹的噪声），元标签无法从无中创造信号。基础假设必须包含某种经济因果关系。