算法重拾之路——strassen矩阵乘法

***************************************转载请注明出处:http://blog.csdn.net/lttree********************************************



第一章:分治与递归


STRASSEN矩阵乘法


算法描述:

        矩阵乘法是线性代数中最常见的问题之一,它在数值计算中有广泛的应用。设A 和 B 是两个n × n矩阵,它们的乘积AB同样是一个n×n矩阵。A和B的乘积矩阵C 中的元素cij定义为:

                                                                   

按照这个定义来看,计算A 与 B 矩阵乘法,至少需要 n 次乘法 与 n-1 次加法,所以可以知道,求矩阵C乘法的时间为O(n^3)

        

 


算法分析:

        strassen矩阵乘法采用类似于 大数乘法 中的分治技术,将计算2个n阶矩阵乘积所需的时间改进到O(n^log7) ≈ O(n^2.81)

 

这个算法有个前提条件,必须是 两个n×n阶矩阵相乘,而且n必须为2的幂。

这样我们每次都可以把大矩阵分割成四个小矩阵:

                                                     

 

上面图可知:

C11 = A11B11 + A12B21

C12 = A11B12 + A12B22

C21 = A21B11 + A22B21

C22 = A21B12 + A22B22

 

        如果 n=2 ,两个2×2阶矩阵乘法需要 8次乘法 和 4次加法。当子矩阵的阶数大于2时,为求两个子矩阵的乘积,可以继续将矩阵分块,直到子矩阵阶数降为2,这就是分治降阶的递归算法。

        按照这个算法,计算2个n阶矩阵的乘积转化为计算8个n/2阶矩阵的乘积和4个 n/2阶 矩阵的加法。 而 2个 n/2阶矩阵的加法显然可以再O(n^2)时间内完成,由此可知上述算法的时间耗费T(n):

 

        T(n)   =         O(1)                                  当n=2

                        =         8T(n/2)+O(n^2)           当n>2

 

        Ok,解这个递归方程,发现 T(n) = O(n^3)。并没有减少!

        这是因为,这个方法并没有减少矩阵的乘法次数,要改进这个算法的时间,必须减少乘法的次数,Strassen就提出了 对于2阶矩阵的乘积方法,只用了7次乘法,用了多次加减,但是效率依然上升了很多。

        这 七次乘法为:

M1 = A11( B12 - B22 )

M2 = (A11 + A12)B22

M3 = (A21 +A22)B11

M4 = A22(B21 - B11)

M5 = (A11 + A22)(B11 + B22)

M6 = (A12 - A22)(B21 + B22)

M7 = (A11 - A21)(B11 + B12)

        做完这七次乘法,通过一些加减就可以得到,最后矩阵的值:

C11 = M5 + M4 - M2 + M6

C12 = M1 + M2

C21 = M3 + M4

C22 = M5 + M1 - M3 - M7

        这样做以后,它的时间T(n)为:

 

        T(n)    =        O(1)                                  当n=2

                        =         7T(n/2)+O(n^2)           当n>2

       

        解得 T(n) = O(n^log7) ≈ O(n^2.81)

 

 

 

 

程序代码:

<span style="font-family:Comic Sans MS;">const int N = 8;     //Define the size of the Matrix

// 输入矩阵
template<typename T>
void input(int n, T p[][N]) {

     for(int i=0; i<n; i++)
        for(int j=0; j<n; j++)
            cin>>p[i][j];
}

// 输出矩阵
template<typename T>
void output(int n, T C[][N]) {

    for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            cout<<C[i][j]<<" ";
        }
        cout<<endl;
    }
}


// 普通的矩阵乘法
template<typename T>
void Matrix_Mul(T A[][N], T B[][N], T C[][N]) {
     for(int i=0; i<2; i++) {
        for(int j=0; j<2; j++) {
            C[i][j] = 0;
            for(int k=0; k<2; k++) {
               C[i][j] = C[i][j] + A[i][k]*B[k][j];
            }
        }
    }
}


// 矩阵加法  C=A+B
template <typename T>
void Matrix_Add(int n, T A[][N], T B[][N], T C[][N]) {
     for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            C[i][j] = A[i][j] + B[i][j];
        }
    }
}


// 矩阵减法  C=A-B
template <typename T>
void Matrix_Sub(int n, T A[][N], T B[][N], T C[][N]) {
    for(int i=0; i<n; i++) {
        for(int j=0; j<n; j++) {
            C[i][j] = A[i][j] - B[i][j];
        }
    }
}

// strassen矩阵乘法
template <typename T>
void Strassen(int n, T A[][N], T B[][N], T C[][N]) {
    // 将第一个矩阵A分割成四个小矩阵
    T A11[N][N], A12[N][N], A21[N][N], A22[N][N];
    // 将第二个矩阵B分割成四个小矩阵
    T B11[N][N], B12[N][N], B21[N][N], B22[N][N];
    // M1~M7 先存起来,为后面最终C矩阵做准备
    T M1[N][N], M2[N][N], M3[N][N], M4[N][N], M5[N][N], M6[N][N], M7[N][N];
    // 四个小矩阵C  最后组合成大矩阵
    T C11[N][N], C12[N][N], C21[N][N], C22[N][N];
    // 中间变量
    T tempA[N][N], tempB[N][N];

    if(n == 2) {
        Matrix_Mul(A, B, C);
    }
    else {
        //将矩阵A和B分成阶数相同的四个子矩阵,即分治思想。
        for(int i=0; i<n/2; i++)
        {
            for(int j=0; j<n/2; j++)
            {
                A11[i][j] = A[i][j];
                A12[i][j] = A[i][j+n/2];
                A21[i][j] = A[i+n/2][j];
                A22[i][j] = A[i+n/2][j+n/2];

                B11[i][j] = B[i][j];
                B12[i][j] = B[i][j+n/2];
                B21[i][j] = B[i+n/2][j];
                B22[i][j] = B[i+n/2][j+n/2];
            }
        }

        /* ****** 分别计算 M1~M7 ****** */

        //Calculate M1 = (A0 + A3) × (B0 + B3)
        Matrix_Add(n/2, A11, A22, tempA);
        Matrix_Add(n/2, B11, B22, tempB);
        Strassen(n/2, AA, BB, M1);

        //Calculate M2 = (A2 + A3) × B0
        Matrix_Add(n/2, A21, A22, tempA);
        Strassen(n/2, tempA, B11, M2);

        //Calculate M3 = A0 × (B1 - B3)
        Matrix_Sub(n/2, B12, B22, tempB);
        Strassen(n/2, A11, tempB, M3);

        //Calculate M4 = A3 × (B2 - B0)
        Matrix_Sub(n/2, B21, B11, tempB);
        Strassen(n/2, A22, tempB, M4);

        //Calculate M5 = (A0 + A1) × B3
        Matrix_Add(n/2, A11, A12, tempA);
        Strassen(n/2, tempA, B22, M5);

        //Calculate M6 = (A2 - A0) × (B0 + B1)
        Matrix_Sub(n/2, A21, A11, tempA);
        Matrix_Add(n/2, B11, B12, tempB);
        Strassen(n/2, tempA, tempB, M6);

        //Calculate M7 = (A1 - A3) × (B2 + B3)
        Matrix_Sub(n/2, A12, A22, tempA);
        Matrix_Add(n/2, B21, B22, tempB);
        Strassen(n/2, tempA, tempB, M7);

        //Calculate C1 = M1 + M4 - M5 + M7
        Matrix_Add(n/2, M1, M4, tempA);
        Matrix_Sub(n/2, M7, M5, tempB);
        Matrix_Add(n/2, tempA, tempB, C11);

        //Calculate C2 = M3 + M5
        Matrix_Add(n/2, M3, M5, C12);

        //Calculate C3 = M2 + M4
        Matrix_Add(n/2, M2, M4, C21);

        //Calculate C4 = M1 - M2 + M3 + M6
        Matrix_Sub(n/2, M1, M2, tempA);
        Matrix_Add(n/2, M3, M6, tempB);
        Matrix_Add(n/2, tempA, tempB, C22);

        //将四个子矩阵组合回大矩阵 C[][N]
        for(int i=0; i<n/2; i++)
        {
            for(int j=0; j<n/2; j++)
            {
                C[i][j] = C11[i][j];
                C[i][j+n/2] = C12[i][j];
                C[i+n/2][j] = C21[i][j];
                C[i+n/2][j+n/2] = C22[i][j];
            }
        }
    }
}</span>


 

 


 

***************************************转载请注明出处:http://blog.csdn.net/lttree********************************************

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。