在《乘、除篇》中提到过一类特殊的乘法--自平方。之所以特殊是因为两个相乘的数是相同的,在进行每一位遍历的时候其实知道的是两个数的信息。
其实乘法之所以需要O(n^2)的复杂度就是因为需要内嵌两层循环来得出两数的全部信息,所以如果仅需遍历一次即可获取信息的话那么在处理自平方的时候即可达到O(n^2/4)级别。
虽然在级别上没有质的飞跃,但是对n较大的时候,计算量的线性减少而提升的性能还是可观的,毕竟不积硅步无已成千里。
接下来我们先讨论实现思路:
1、将超长整数An (n表示整数长度)划分成两段L1,L2,则L1=L2=n/2(非整除时选择L1=L2+1或者L2=L1+1任取)(例如:L1:0...n/2 ;L2:n/2...n)
2、分别 An 中每一位的各自的平方和,每一位得出的结果存入Li‘ = L(i+i),其中 i‘ = i+i
3、执行一次 L1 和 L2 中每一位乘法运算,将每次运算的结果扩大2倍即可,存入对应结果位置Lk = Li + Lj,其中 k = i+j
Code View:
/* 自平方运算 */ int mulHBInt(HBigInt *product, HBigInt *biA){ HBigInt biT; //计算结果先保存在临时变量中 register un_short *pWordA = biA->pBigInt; register un_short *pPrd = NULL; long result = 0, i = 0, j = 0, index=0; //初始化临时大整数变量 if((result = initHBInt(&biT,biA->length<<1)) != RETURN_OK_BINT) return result; biT.length = biA->length << 1; biT.sign = 1; pPrd = biT.pBigInt; index = biA->length >> 1; for(i=0; i<biT.length; ++i) { pPrd[i+i] = pWordA[i]*pWordA[i]; } for(i=0; i<index; ++i) { for(j=index; j<biA->length; ++j) { pPrd[i+j] += ((pWordA[i] * pWordA[j]) << 1); // 如果超出单位长度能表示最大的值(本例中是2<<16),则进行一次格式化处理 if(pPrd[i+j] >> BIT_PRE_WORD) formatHBInt(&biT); } } trimHBInt(&biT);//去除高位无效的0 extendHBInt(product,biT.length); assignHBInt(product,&biT); deleteHBInt(&biT); //清除临时变量 return RETURN_OK_BINT; }
展望:
在程序中其实复杂度为O(n+n^2/4),相较于纯平方级的复杂度可谓提升有限,但是为并行算法的实现提供了一个思路,因为可以做数据分解,分解的粒度可以根据处理机的配置而定制。后续笔者会对所有的算法(超长整数部分)进行并行改造,一方面提升自己的能力,同时也请各位指正。毕竟大家好,才是真的好!
原文地址:http://blog.csdn.net/yjbqzsf/article/details/41746223