Error function we can choose in curve fitting

在曲线拟合中，选择误差函数（error function）是为了衡量模型预测值与实际观测值之间的差异。误差函数通常用于优化过程中，指导算法调整模型参数以最小化误差。以下是一些常用的误差函数：

均方误差（Mean Squared Error, MSE）:
- 误差的平方和的平均值，是最常用的误差函数之一。
- 公式： $MSE = (1/ n) * Σ (y_{i} - f (x_{i}))^{2}$ ，其中 $y_{i}$ 是实际观测值， $f (x_{i})$ 是模型预测值， $n$ 是数据点的数量。
均方根误差（Root Mean Squared Error, RMSE）:
- MSE的平方根，与观测值具有相同的单位，因此更容易解释。
- 公式： $RMSE = \sqrt (1/ n) * Σ (y_{i} - f (x_{i}))^{2}$ 。
平均绝对误差（Mean Absolute Error, MAE）:
- 误差的绝对值的平均值，对异常值不如MSE敏感。
- 公式： $M A E = (1/ n) * Σ∣ y_{i} - f (x_{i}) ∣$ 。
平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）:
- 误差与实际观测值的百分比的绝对值的平均值，常用于百分比或比率数据的拟合。
- 公式： $M A PE = (1/ n) * Σ∣ (y_{i} - f (x_{i})) / y_{i} ∣ * 100$ 。
对数似然误差（Log-Likelihood Error）:
- 常用于概率模型，如最大似然估计。
- 公式依赖于特定的概率分布。
交叉熵误差（Cross-Entropy Error）:
- 也称为对数损失，常用于分类问题和神经网络的训练。
- 公式： $C ross - E n t ro p y = - Σ y_{i} * l o g (f (x_{i})) + (1 - y_{i}) * l o g (1 - f (x_{i}))$ 。
Huber损失（Huber Loss）:
- 结合了MSE和MAE的特点，对异常值具有较强的鲁棒性。
- 公式： $H u b er (y_{i}, f (x_{i}), δ) = ∣ y_{i} - f (x_{i}) ∣ i f ∣ y_{i} - f (x_{i}) ∣ \leq δ, (1/2) * (∣ y_{i} - f (x_{i}) ∣^{2} - δ^{2}) o t h er w i se$ 。
分位数损失（Quantile Loss）:
- 用于分位数回归，关注模型预测的分位数与实际观测值的分位数之间的误差。
- 公式： $Q u an t i l e L oss = Σ (τ * (y_{i} - f (x_{i})) i f y_{i} > f (x_{i}), (1 - τ) * (f (x_{i}) - y_{i}) o t h er w i se$ ，其中τ是分位数。

在选择误差函数时，应考虑数据的特性、模型的目的和误差分布。例如，对于包含许多异常值的数据，使用Huber损失或MAE可能更合适。对于概率预测问题，对数似然误差或交叉熵误差可能更适用。

🎣 JudeW's Knowledge Brain

Recent writing

Casual Self Attention

KV Cache

前庭功能快速筛查与居家监测设备 - 产品提案

Error function we can choose in curve fitting

Graph View

Backlinks