标签:
矩阵相乘最简单的形式就是一个三层循环,首先给出表示形式:C=A*B,其中A是左矩阵,是i*k的矩阵,B是右矩阵,是k*j的矩阵。
1)第一种方法就是以“行*列”的方式来计算,代码如下:
int leftMatrixRows,leftMatrixColumns,rightMatrixColumns; leftMatrixRows=leftMatrix.length;//i leftMatrixColumns=leftMatrix[0].length;//k rightMatrixColumns=rightMatrix[0].length;//j double[][] resultMatrix=new double[leftMatrixRows][rightMatrixColumns]; for (int i = 0; i < leftMatrixRows; i++) { for (int j = 0; j < rightMatrixColumns; j++) { for (int k = 0; k < leftMatrixColumns; k++) { resultMatrix[i][j] += leftMatrix[i][k] * rightMatrix[k][j]; } } }
运行时间是551s
2)第二种方法不是直接采用“行*列”的方式来计算,而是直接取出右矩阵的一行,分别与左矩阵的一个元素相乘,其实就是“行*行”的方式,,代码如下:
for (int i = 0; i < leftMatrixRows; i++) { for (int k = 0; k < leftMatrixColumns; k++) { for (int j = 0; j < rightMatrixColumns; j++) { resultMatrix[i][j] += leftMatrix[i][k] * rightMatrix[k][j]; } } }
运行时间是21s。比第一种方法快了很多,其实原因很简单,我们每次乘的时候,是从左矩阵取出一个元素,然后与右矩阵的一行的每个元素做乘法。二维数组在内存中的存放方式是行优先,也就是二位数组的一行中的各个元素是相邻存放的。然后就需要了解cpu中cache的作用,cache是cpu中的高速缓存,cpu从内存中取数据时,会将这个数据相邻的元素也取出来,存放在cache中。在这里,当我们将右矩阵某行的第一个元素与左矩阵的一个元素相乘时,cpu从内存中取到这个元素,并且将这个元素相邻的若干元素也读取到cache中,也就是将右矩阵这个行的其它元素也“顺道”读取到了cache中,节省了再去内存中读取数据的过程,自然速度就快了很多。
标签:
原文地址:http://www.cnblogs.com/lz3018/p/5377641.html