码迷,mamicode.com
首页 > 其他好文 > 详细

【转】gcc的__builtin_函数介绍

时间:2017-05-16 15:49:36      阅读:124      评论:0      收藏:0      [点我收藏+]

标签:函数名   效率   代码   res   http   优化   内核   tmp   unsigned   

转自:http://blog.csdn.net/jasonchen_gbd/article/details/44948523

GCC提供了一系列的builtin函数,可以实现一些简单快捷的功能来方便程序编写,另外,很多builtin函数可用来优化编译结果。这些函数以“__builtin_”作为函数名前缀。
很多C标准库函数都有与之对应的GCC builtin函数,例如strcpy()有对应的__builtin_strcpy()内建函数。
下面就介绍一些builtin函数及其作用:

__builtin_ffs(x):返回x中最后一个为1的位是从后向前的第几位,如__builtin_ffs(0x789)=1, __builtin_ffs(0x78c)=3。于是,__builtin_ffs(x) - 1就是x中最后一个为1的位的位置。

__builtin_popcount(x):x中1的个数。

__builtin_ctz(x):x末尾0的个数。x=0时结果未定义。

__builtin_clz(x):x前导0的个数。x=0时结果未定义。

上面的宏中x都是unsigned int型的,如果传入signed或者是char型,会被强制转换成unsigned int。

__builtin_parity(x):x中1的奇偶性。

__builtin_return_address(n):当前函数的第n级调用者的地址,用的最多的就是__builtin_return_address(0),即获得当前函数的调用者的地址。注意,该函数实现是体系结构相关的,有些体系结构只实现了n=0的返回结果。

uint16_t __builtin_bswap16 (uint16_t x)

uint32_t __builtin_bswap32 (uint32_t x):按字节翻转x,返回翻转后的结果。

__builtin_prefetch (const void *addr, ...):它通过对数据手工预取的方法,在使用地址addr的值之前就将其放到cache中,减少了读取延迟,从而提高了性能,但该函数也需要 CPU 的支持。该函数可接受三个参数,第一个参数addr是要预取的数据的地址,第二个参数可设置为0或1(1表示我对地址addr要进行写操作,0表示要进行读操作),第三个参数可取0-3(0表示不用关心时间局部性,取完addr的值之后便不用留在cache中,而1、2、3表示时间局部性逐渐增强)。
__builtin_constant_p (exp):判断exp是否在编译时就可以确定其为常量,如果exp为常量,该函数返回1,否则返回0。如果exp为常量,可以在代码中做一些优化来减少处理exp的复杂度。
__builtin_types_compatible_p(type1, type2):判断type1和type2是否是相同的数据类型,相同返回1,否则返回0。该函数不区分const/volatile这样的修饰符,即int和const int被认为是相同的类型。

  1 #define foo(x)
  2 ({
  3 typeof(x) tmp = (x);  4 if(__builtin_types_compatible_p(typeof(x), int))  5 //do something...\
  6 else   7 //do something...\
  8 tmp;
  9 })

__builtin_expect (long exp, long c):用来引导gcc进行条件分支预测。在一条指令执行时,由于流水线的作用,CPU可以完成下一条指令的取指,这样可以提高CPU的利用率。在执行一条条件分支指令时,CPU也会预取下一条执行,但是如果条件分支跳转到了其他指令,那CPU预取的下一条指令就没用了,这样就降低了流水线的效率。内核中的likely()和unlikely()就是通过__builtin_expect来实现的。
__builtin_expect (long exp, long c)函数可以优化程序编译后的指令序列,使指令尽可能的顺序执行,从而提高CPU预取指令的正确率。该函数的第二个参数c可取0和1,
例如:
  1 if (__builtin_expect (x, 0))
  2             foo ();

表示x的值大部分情况下可能为0,因此foo()函数得到执行的机会比较少。gcc就不必将foo()函数的汇编指令紧挨着if条件跳转指令。
由于第二个参数只能取整数,所以如果要判断指针或字符串,可以像下面这样写:
  1 if (__builtin_expect (ptr != NULL, 1))
  2             foo (*ptr);

表示ptr一般不会为NULL,所以foo函数得到执行的概率较大,gcc会将foo函数的汇编指令放在挨着if跳转执行的位置。

【转】gcc的__builtin_函数介绍

标签:函数名   效率   代码   res   http   优化   内核   tmp   unsigned   

原文地址:http://www.cnblogs.com/liuzhanshan/p/6861596.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!