公平性度量

1. 公平性度量

简介

在二元期权交易及更广泛的机器学习领域，模型公平性已成为一个日益重要的议题。仅仅追求高准确率不足以确保一个负责任且符合道德的模型。模型可能会对不同的人口统计群体产生系统性的偏见，导致不公平的结果。公平性度量提供了一系列用于量化和评估这些偏见的工具，帮助我们构建更公平、更可靠的系统。本文将深入探讨公平性度量的概念，介绍常用的度量指标，并讨论它们的应用和局限性。

公平性的定义

“公平”本身就是一个复杂的概念，具有多种不同的定义。在机器学习的背景下，公平性通常指的是模型在不同群体之间表现出相似的性能，并且不会因为敏感属性（例如种族、性别、年龄等）而产生歧视。然而，不同的公平定义之间可能存在冲突，因此选择合适的公平定义取决于具体的应用场景和伦理考量。

常见的公平性定义包括：

**群体公平性 (Group Fairness):** 关注不同群体之间的统计差异。例如，不同种族群体在模型预测中的阳性率应该大致相同。
**个体公平性 (Individual Fairness):** 要求相似的个体应该得到相似的预测结果。
**机会均等性 (Equal Opportunity):** 确保所有群体都有相同的机会获得积极结果，前提是他们拥有相同的资格。
**预测均等性 (Predictive Equality):** 确保模型对所有群体的预测准确性相同。

为什么需要公平性度量

**道德考量：** 避免对特定群体造成不公平的歧视，符合伦理规范。一个在技术分析中偏颇的模型会误导交易员，产生不合理的风险管理决策。
**法律合规：** 许多国家和地区都制定了相关法律法规，禁止基于敏感属性的歧视行为。
**业务风险：** 不公平的模型可能会损害品牌声誉，导致客户流失，并引发法律诉讼。
**模型可靠性：** 偏见可能导致模型泛化能力下降，影响其在实际应用中的表现。例如，在成交量分析中，一个偏颇的模型可能无法准确预测未来的市场趋势。
**信任度提升：** 公平的模型更容易获得用户信任，并被更广泛地接受。

常用的公平性度量指标

以下是一些常用的公平性度量指标，它们分别关注不同的公平性维度：

**统计均等性差异 (Statistical Parity Difference):** 衡量不同群体在模型预测中阳性率的差异。公式为：P(Ŷ = 1 | A = a) - P(Ŷ = 1 | A = b)，其中 Ŷ 是预测结果，A 是敏感属性，a 和 b 是敏感属性的不同值。理想情况下，该值应接近于 0。风险回报比的差异也可能反映统计均等性问题。
**均等机会差异 (Equal Opportunity Difference):** 衡量不同群体在真阳性率 (True Positive Rate) 上的差异。公式为：P(Ŷ = 1 | Y = 1, A = a) - P(Ŷ = 1 | Y = 1, A = b)，其中 Y 是真实标签。
**预测均等性差异 (Predictive Equality Difference):** 衡量不同群体在假阳性率 (False Positive Rate) 上的差异。公式为：P(Ŷ = 1 | Y = 0, A = a) - P(Ŷ = 1 | Y = 0, A = b)。
**平均绝对误差差异 (Average Absolute Odds Difference):** 结合了均等机会差异和预测均等性差异，衡量不同群体在真阳性率和假阳性率上的平均差异。
**差异影响 (Disparate Impact):** 衡量不同群体获得积极结果的比例之间的差异。通常使用 80% 规则，即弱势群体的积极结果比例至少应为强势群体的 80%。
**条件概率差异 (Conditional Demographic Disparity):** 衡量在给定预测结果的情况下，不同群体之间的差异。
**Theil 指数:** 一种衡量收入不平等程度的指标，也可以用于衡量模型预测结果的不平等程度。
**基于校准的度量:** 评估模型的校准程度，即模型预测的概率是否与其真实发生的概率相符。例如，蒙特卡洛模拟可以用于校准模型。
**基尼系数 (Gini Coefficient):** 衡量收入或财富分配的不平等程度，也可用于评估模型预测结果的不平等程度。
**KS 统计量 (Kolmogorov-Smirnov Statistic):** 用于比较不同群体之间的累积分布函数，评估其差异。

| 度量指标 | 描述 | 关注点 | |---|---|---| | 统计均等性差异 | 比较不同群体预测阳性率的差异 | 群体公平性 | | 均等机会差异 | 比较不同群体真阳性率的差异 | 机会均等性 | | 预测均等性差异 | 比较不同群体假阳性率的差异 | 预测均等性 | | 差异影响 | 衡量不同群体获得积极结果的比例差异 | 群体公平性 |