线性代数

SVD

奇异值分解

对于任意矩阵 \(A \in \mathbb{R}^{m \times n}\)

都存在分解

\[ A = U \Sigma V^T \]

其中

  • \(U \in \mathbb{R}^{m \times m}\) :左奇异向量,正交矩阵\((U^T U = I)\)

  • \(\Sigma \in \mathbb{R}^{m \times n}\) : 奇异值矩阵 对角线非负

  • \(V \in \mathbb{R}^{n \times n}\) :右奇异向量 正交矩阵

SVD是一个三步的线性变换

\[ x \xrightarrow{V^\top} \text{旋转} \xrightarrow{\Sigma} \text{拉伸} \xrightarrow{U} \text{再旋转} \]
  • \(V^T\): 把输入坐标系旋转到主方向

  • \(\Sigma\): 沿正交方向按奇异值缩放

  • \(U\): 映射到输出空间

低秩近似

只保留矩阵中最重要的几个方向 其他方向当成噪声掩盖掉

SVD方法是最优的低秩近似(Eckart-Young定理): 在所有\(rank \leq k\)的矩阵中 截断SVD给出的\(A_k\) 是误差(Frobenius范数误差)最小的

Frobenius范数

对于矩阵\(A = (a_{ij})\)

\[ \| A\|_F = \sqrt{\sum_{i,j}a_{ij}^2} \]

即所有元素的平方和