6.3.5 为类型转换产生汇编代码
在这一小节中,我们来讨论一下整型和浮点型之间的类型转换。有些类型转换并不需要在汇编层次进行数据转换,例如int和unsigned int之间的转换只是改变了表达式的类型,对数据本身并无影响,以下表达式“(unsigned int) a”对应的二进制数据为0xFFFFFFFF,而表达式“a”对应的二进制数据也为0xFFFFFFFF。但对相同内容的二进制数据来说,进行“有符号整数的右移”和“无符号整数的右移”的结果是不一样的。换言之,对于int和unsigned int之间的转换,我们只要在语义检查时,保存转型后的新类型即可,由于其数据本身并没有发生变化,我们不需要产生任何进行数据格式转换的汇编代码。
int a = -1;
unsigned int b;
b = ((unsigned int) a)>> 30; //b为3
b = a >> 30; //b为0xFFFFFFFF
还有一点需要注意的是,UCC编译器总是把低于int的整型先隐式地提升为int,然后再进行其他转换。如下所示,当要进行“short-- > char”的转换时,我们会以int作为中转,实际进行的转换为“short -- > int -- > char”。
short s = 3;
char c=(char)s;
////////////////////对应的中间代码/////////////////
t0 : (int)(short)s; // short先提升为int
c = (char)(int)t0; //再把int截断为char
///////////////////对应的汇编代码///////////////////
movswl s, %eax //两字节的short扩展为4字节的int
movb %al, c //只取低字节赋给c
因此,在UCC编译器的类型转换中,“需要通过汇编代码来进行数据格式转换的”主要有以下几种,其中In分别代表占n字节的有符号整数,Un分别代表占n字节的无符号整数,F4代表float,F8代表double。
(1) “I1、U1、I2或者U2”提升为I4
由“单字节或双字节”的整数进行符号位扩展,得到4字节的整数。
C程序员可以进行“U1 -->U2”的转换,但UCC在语义检查阶段已改为
“U1 --> int -- > U2”的转换。在汇编代码生成阶段,不会遇到“U1 --> U2 ”。
(2) “I4或者U4”截断为I1
只取“4字节的整数”低8位,得到一个单字节的数据。
在汇编层次,“I4或者U4”截断为U1,也是取低8位的数据。
(3) “I4或者U4”截断为I2
只取“4字节的整数”低16位,得到一个双字节的数据。
在汇编层次,“I4或者U4”截断为U2,也是取低16位的数据。
(4) “I4或者U4”转换为“F4或者F8”
通过x87协处理器进行数据格式转换,将整型转换为浮点数。
(5) “F4或者F8”转换为I4或者U4
通过x87协处理器进行数据格式转换,将浮点数转换为整数。
(6) “F4”与“F8”之间互相转换
通过x87协处理器进行数据格式转换,实现float与double之间的转换。
当然,在一些没有浮点协处理器的中低端嵌入式平台上,浮点数运算需要由CPU通过整数运算来得到,这一般会由相应的浮点运算函数库来实现。下面,我们通过一个简单的例子来熟悉一下用于类型转换的汇编代码,如图6.3.12所示。第15行的movsbl指令用于对i1进行符号位扩展,从而得到4字节的int;第18行的movb指令用于传送一个字节的数据,第20行的movw用于传送两个字节的数据。第21至24行用于实现int到float的数据转换,我们在第21行把i4的值入栈,第22行把栈内存中的整数加载到x87中,第23行把经x87转换后的浮点数赋值给f4,第24行进行esp寄存器的调整以保存栈的平衡,这几行汇编代码是由以下模板得来,并非最优,但简单易懂。
TEMPLATE(X86_CVTI4F4, "pushl %1;fildl (%%esp);fstps %0;addl$4, %%esp")
图6.3.12 类型转换对应的汇编代码
图6.3.12第37行从内存加载double型浮点数到x87协处理器中,第38行把转换后的float数据存到f4中。而第25至36行的汇编代码用于实现float到int的数据转换,其中很大一部分代码用来设置x87的控制寄存器,从而设定“四舍五入”的精度。我们已在“第1.5节 结合C语言来学汇编_浮点数运算”一节的“图1.30”中分析过这些汇编代码,这里不再重复。第25至36行的汇编代码是根据以下模板产生的,其中用到了寄存器eax,因此在产生这些汇编代码前,我们需要先对寄存器eax进行必要的回写操作。
TEMPLATE(X86_CVTF4I4,
"flds %1;subl $16, %%esp;fnstcw(%%esp);movzwl (%%esp), %%eax;"
"orl $0x0c00, %%eax;movl %%eax,4(%%esp);fldcw 4(%%esp);fistpl 8(%%esp);"
"fldcw (%%esp);movl 8(%%esp),%%eax;addl $16, %%esp")
接下来,我们来讨论一下用于生成这些汇编代码的函数EmitCast,如图6.3.13所示。第9至20行用于实现{I1,U1,I2,U2}到I4的整型提升,我们面对的中间指令形如“< EXTI1,DST, SRC1, NULL>”。我们会在第6行把目的操作数DST保存到局部变量dst中,第12行调用AllocateReg函数为DST分配一个4字节寄存器,如果DST不是临时变量,则分配不成功。此时,我们需要在第14行直接调用GetReg函数来得到一个寄存器,并重新设置中间指令里的DST操作数,这会导致“DST != dst”。不论如何,在第16行,我们已得到一个寄存器,不妨记为Rx,第16行通过形如movsbl的汇编指令进行符号位扩展,并把结果存到Rx中。如果“原先的目的操作数dst”不是临时变量,则我们还要在第18行把寄存器Rx中的值传送给dst,最终可得到形如“movsbl i1, %eax; movl %eax, i4”这样的汇编代码。
图6.3.13 EmitCast()
图6.3.13第21至30行用于实现{I4,U4}到I1的截断操作,我们面对的中间指令形如
“< TRUI1, DST, SRC1, NULL>”。如果SRC1的值已经在寄存器中,不妨设其为eax,则我们可在第23行得到eax的低8位对应的寄存器al;否则,我们在第26行获取一个单字节寄存器,不妨设其为al,第27行会把“占4字节的操作数SRC1的值”传送到寄存器eax中,由于eax寄存器的低8位就是寄存器al,因此我们可在第30行把al的值传送给目的操作数DST,最终可产生形如“movl i4, %eax;movb %al, i1;”的汇编代码。而{I4,U4}到I2的截断操作与此类似,我们在第32行省略了相关代码。
图6.3.13第33至39行用于实现整型到浮点型的转换,我们在第38行调用PutASMCode函数,根据相应的模板来产生汇编代码即可。第42至50行用于实现浮点型到整型的转换,我们面对的中间指令形如“<CVTF4I4, DST, SRC1, NULL>”,其中DST为整数,而SRC1为浮点数。由于在X86_CVTF4I4模板中用到了寄存器eax,因此我们要在第44行调用SpillReg函数对eax进行必要的回写操作,第45行为DST分配一个4字节寄存器,不妨记为Rx,第46行根据X86_CVTF4I4等指令模板产生相应的汇编代码,实现浮点数到整数的转换,结果保存在寄存器eax中。如果中间指令里的操作数DST不是临时变量,或者DST是临时变量但所分配的寄存器不是eax,则我们要在第49行把eax寄存器中的值传送给DST。C编译器剖析_6.3.5 汇编代码生成_为类型转换产生汇编代码
原文地址:http://blog.csdn.net/sheisc/article/details/45423021