算法重拾之路——strassen矩阵乘法

浏览数：29 / 时间：2015年06月08日

***************************************转载请注明出处：http://blog.csdn.net/lttree********************************************

第一章：分治与递归

STRASSEN矩阵乘法

算法描述：

矩阵乘法是线性代数中最常见的问题之一，它在数值计算中有广泛的应用。设A 和 B 是两个n × n矩阵，它们的乘积AB同样是一个n×n矩阵。A和B的乘积矩阵C 中的元素cij定义为：

按照这个定义来看，计算A 与 B 矩阵乘法，至少需要 n 次乘法与 n-1 次加法，所以可以知道，求矩阵C乘法的时间为O(n^3)

算法分析：

strassen矩阵乘法采用类似于大数乘法中的分治技术，将计算2个n阶矩阵乘积所需的时间改进到O（n^log7) ≈ O（n^2.81）

这个算法有个前提条件，必须是两个n×n阶矩阵相乘，而且n必须为2的幂。

这样我们每次都可以把大矩阵分割成四个小矩阵：

由上面图可知：

C11 = A11B11 + A12B21

C12 = A11B12 + A12B22

C21 = A21B11 + A22B21

C22 = A21B12 + A22B22

如果 n=2 ，两个2×2阶矩阵乘法需要 8次乘法和 4次加法。当子矩阵的阶数大于2时，为求两个子矩阵的乘积，可以继续将矩阵分块，直到子矩阵阶数降为2，这就是分治降阶的递归算法。

按照这个算法，计算2个n阶矩阵的乘积转化为计算8个n/2阶矩阵的乘积和4个 n/2阶矩阵的加法。而 2个 n/2阶矩阵的加法显然可以再O（n^2）时间内完成，由此可知上述算法的时间耗费T（n）：

T（n） = O（1）当n=2

= 8T（n/2）+O（n^2）当n>2

Ok,解这个递归方程，发现 T（n） = O（n^3）。并没有减少！

这是因为，这个方法并没有减少矩阵的乘法次数，要改进这个算法的时间，必须减少乘法的次数，Strassen就提出了对于2阶矩阵的乘积方法，只用了7次乘法，用了多次加减，但是效率依然上升了很多。

这七次乘法为：

M1 = A11( B12 - B22 )

M2 = (A11 + A12)B22

M3 = (A21 +A22)B11

M4 = A22(B21 - B11)

M5 = (A11 + A22)(B11 + B22)

M6 = (A12 - A22)(B21 + B22)

M7 = (A11 - A21)(B11 + B12)

做完这七次乘法，通过一些加减就可以得到，最后矩阵的值：

C11 = M5 + M4 - M2 + M6

C12 = M1 + M2

C21 = M3 + M4

C22 = M5 + M1 - M3 - M7

这样做以后，它的时间T（n）为：

T（n） = O（1）当n=2

= 7T（n/2）+O（n^2）当n>2

解得 T（n） = O（n^log7） ≈ O（n^2.81）

程序代码：

<span style="font-family:Comic Sans MS;">const int N = 8;     //Define the size of the Matrix

// 输入矩阵
template<typename T>
void input(int n, T p[][N]) {

     for(int i=0; i<n; i++)
        for(int j=0; j<n; j++)
            cin>>p[i][j];
}

// 输出矩阵
template<typename T>
void output(int n, T C[][N]) {

    for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            cout<<C[i][j]<<" ";
        }
        cout<<endl;
    }
}


// 普通的矩阵乘法
template<typename T>
void Matrix_Mul(T A[][N], T B[][N], T C[][N]) {
     for(int i=0; i<2; i++) {
        for(int j=0; j<2; j++) {
            C[i][j] = 0;
            for(int k=0; k<2; k++) {
               C[i][j] = C[i][j] + A[i][k]*B[k][j];
            }
        }
    }
}


// 矩阵加法  C=A+B
template <typename T>
void Matrix_Add(int n, T A[][N], T B[][N], T C[][N]) {
     for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            C[i][j] = A[i][j] + B[i][j];
        }
    }
}


// 矩阵减法  C=A-B
template <typename T>
void Matrix_Sub(int n, T A[][N], T B[][N], T C[][N]) {
    for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            C[i][j] = A[i][j] - B[i][j];
        }
    }
}

// strassen矩阵乘法
template <typename T>
void Strassen(int n, T A[][N], T B[][N], T C[][N]) {
    // 将第一个矩阵A分割成四个小矩阵
    T A11[N][N], A12[N][N], A21[N][N], A22[N][N];
    // 将第二个矩阵B分割成四个小矩阵
    T B11[N][N], B12[N][N], B21[N][N], B22[N][N];
    // M1~M7 先存起来，为后面最终C矩阵做准备
    T M1[N][N], M2[N][N], M3[N][N], M4[N][N], M5[N][N], M6[N][N], M7[N][N];
    // 四个小矩阵C  最后组合成大矩阵
    T C11[N][N], C12[N][N], C21[N][N], C22[N][N];
    // 中间变量
    T tempA[N][N], tempB[N][N];

    if(n == 2) {
        Matrix_Mul(A, B, C);
    }
    else {
        //将矩阵A和B分成阶数相同的四个子矩阵，即分治思想。
        for(int i=0; i<n/2; i++)
        {
            for(int j=0; j<n/2; j++)
            {
                A11[i][j] = A[i][j];
                A12[i][j] = A[i][j+n/2];
                A21[i][j] = A[i+n/2][j];
                A22[i][j] = A[i+n/2][j+n/2];

                B11[i][j] = B[i][j];
                B12[i][j] = B[i][j+n/2];
                B21[i][j] = B[i+n/2][j];
                B22[i][j] = B[i+n/2][j+n/2];
            }
        }

        /* ****** 分别计算 M1~M7 ****** */

        //Calculate M1 = (A0 + A3) × (B0 + B3)
        Matrix_Add(n/2, A11, A22, tempA);
        Matrix_Add(n/2, B11, B22, tempB);
        Strassen(n/2, AA, BB, M1);

        //Calculate M2 = (A2 + A3) × B0
        Matrix_Add(n/2, A21, A22, tempA);
        Strassen(n/2, tempA, B11, M2);

        //Calculate M3 = A0 × (B1 - B3)
        Matrix_Sub(n/2, B12, B22, tempB);
        Strassen(n/2, A11, tempB, M3);

        //Calculate M4 = A3 × (B2 - B0)
        Matrix_Sub(n/2, B21, B11, tempB);
        Strassen(n/2, A22, tempB, M4);

        //Calculate M5 = (A0 + A1) × B3
        Matrix_Add(n/2, A11, A12, tempA);
        Strassen(n/2, tempA, B22, M5);

        //Calculate M6 = (A2 - A0) × (B0 + B1)
        Matrix_Sub(n/2, A21, A11, tempA);
        Matrix_Add(n/2, B11, B12, tempB);
        Strassen(n/2, tempA, tempB, M6);

        //Calculate M7 = (A1 - A3) × (B2 + B3)
        Matrix_Sub(n/2, A12, A22, tempA);
        Matrix_Add(n/2, B21, B22, tempB);
        Strassen(n/2, tempA, tempB, M7);

        //Calculate C1 = M1 + M4 - M5 + M7
        Matrix_Add(n/2, M1, M4, tempA);
        Matrix_Sub(n/2, M7, M5, tempB);
        Matrix_Add(n/2, tempA, tempB, C11);

        //Calculate C2 = M3 + M5
        Matrix_Add(n/2, M3, M5, C12);

        //Calculate C3 = M2 + M4
        Matrix_Add(n/2, M2, M4, C21);

        //Calculate C4 = M1 - M2 + M3 + M6
        Matrix_Sub(n/2, M1, M2, tempA);
        Matrix_Add(n/2, M3, M6, tempB);
        Matrix_Add(n/2, tempA, tempB, C22);

        //将四个子矩阵组合回大矩阵 C[][N]
        for(int i=0; i<n/2; i++)
        {
            for(int j=0; j<n/2; j++)
            {
                C[i][j] = C11[i][j];
                C[i][j+n/2] = C12[i][j];
                C[i+n/2][j] = C21[i][j];
                C[i+n/2][j+n/2] = C22[i][j];
            }
        }
    }
}</span>

***************************************转载请注明出处：http://blog.csdn.net/lttree********************************************

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

算法重拾之路——strassen矩阵乘法