ML创新点

通用型

基本上都是即插即用的万金油

通过数学变换大幅减少卷积计算量

在传统的卷积优化中可以使用FFT, 但是FFT在针对于大的卷积核时才有明显优势,而且限制比较多.

对于现在的小卷积核 Winograd算法的优势便很明显

Winograd算法基于国剩余定理 将空间域的卷积变换到Winograd域计算

Winograd的符号是 \(F(m,n)\) 代表输出m个点卷积核大小n

Winograd乘法计算次数为: m + n - 1

普通卷积乘法计算次数为: m * n

注意: Winograd在FP32下表现很好在其他量化下可能导致量化精度降低很多很多

注意: 插值点的选用非常重要

计算F(m,r)的变换矩阵

由中国剩余定理想确定一个n次多项式需要n+1个点

根据选定的插值点集合构造一个 n*n的Vandermonde矩阵

\[ Output = A^T [(G g G^T) \cric (B^T dB)]A \]

其中