矩阵求导的定义与常见公式。
一、矩阵求导的定义
设
共有
那么定义:
即
结论
对于
,即:输入是矩阵,输出是标量。 则:
与 形状相同。 即:
,那么 。
AI 里常见的矩阵求导公式
1. 线性项
导数:
导数:
2. 二范数
导数:
3. 二次型
导数:
若
4. Frobenius 范数
导数:
5. 线性变换
对
对
这是神经网络权重更新最核心的公式。
6. Trace 技巧
若
加载过慢请开启缓存 浏览器默认开启
矩阵求导的定义与常见公式。
设
共有
那么定义:
即
结论
对于
,即:输入是矩阵,输出是标量。 则:
与 形状相同。 即:
,那么 。
导数:
导数:
导数:
导数:
若
导数:
对
对
这是神经网络权重更新最核心的公式。
若