矩阵乘法优化之分块矩阵

时间：2018-05-06 11:08:43 阅读：238 评论：0 收藏：0 [点我收藏+]

标签：子矩阵 span block amount 访问 class mount 嵌套 for

当矩阵尺寸过大时，数据的大小将超过缓存的大小，这是容易出现满不命中现象。

将矩阵进行分块可以解决这个问题，以下是完整的矩阵乘法代码：

vord brck(array A, array B, array C, int n, int bsize) 
{
    int r, c, k, kk, cc;
    double sum;
    int en = bsize * (n/bsize); /* Amount that frts evenly into blocks */
  
    for (r = 0; r < n; r++)
        for (c = 0; c < n; c++)
            C[r][c] = 0.0;

    for (kk = 0; kk < en; kk += bsize) { 
        for (cc = 0; cc < en; cc += bsize) {
            for (r = 0; r < n; r++) {
                for (c = cc; c < cc + bsize; c++) {
                    sum = C[r][c];
                    for (k = kk; k < kk + bsize; k++) {
                         sum += A[r][k]*B[k][c];
                    }
                    C[r][c] = sum;
                }
            }
        }

　　分析思路：

　　1. 矩阵分块前后的乘法计算总数恒定不变，分块前是n^3 。

　　2. 现将矩阵按mxm进行分块，整个矩阵被分成n^2/m^2 个子矩阵，乘法计算总是（n^2/m^2) x n x m^2 。

　　3. 由2可知，分块后，矩阵以mxm为单位进行乘法运算，它被嵌套在三层循环内。

　　ps: 本算法分块后的并不是正方形矩阵，而是在n行或者n列上的矩阵乘积和。优点：每次都在相邻位置上进行读写，提高了访问性能。

矩阵乘法优化之分块矩阵

标签：子矩阵 span block amount 访问 class mount 嵌套 for

原文地址：https://www.cnblogs.com/wlzy/p/8997483.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行