本人由于最近在读取h264文件的时候,遇到如何读取完整一帧数据的问题,通过使用elecard stream analyzer工具,以及结合《新一代视频压缩编码标准--H264/AVC》(第二版)书,并在网上查找总结如下:
首先NAL句法,片头句法以及nal_unit_type语义必须知道:
以上两图截自《新一代视频压缩编码标准--H264/AVC》(第二版)
简单的区分帧的方法就是读取文件的时候与0x00 0x00 0x00 0x01比较,如果相等认为是一个片,再读取一个字节就对应表6.1的forbidden_zero_bit(1bit),nal_ref_idc(2bit),nal_unit_type(5bit),nal_unit_type值根据表6.20可以确定该帧类型,对于7,8是没有first_mb_in_slice,可以一直读到下一个0x00 0x00 0x00 0x01这之间的数据都是参数集数据。对于1,5都是有first_mb_in_slice并且每一帧第一片的first_mb_in_slice都是0,这对于分成多片的一帧数据的获取是很有用的。
下面是指数哥伦布码的解析:来自http://blog.csdn.net/simongyley/article/details/8517817
first_mb_in_slice是需要对h264通过ExpGolomb编码过的一串2进制数进行ExpGolomb解码得到,通过在网上多方查找并结合h264的文件分析,终于找到了计算方法,现在跟大家分享一下,有不对的地方欢迎指正。
I帧情况:
如下图所示:
88 80 = 1000 1000 1000 0000 假设阶数为0,那么leadingZeroBits=0, CodeNum(first_mb_in_slice) = 1-1+0=0
06 62 = 0000 0110 0110 0010 假设阶数为0,那么LeadingZeroBits=5, CodeNum(first_mb_in_slice)=2EXP(5)-2EXP(0)+10011(2进制)=32-1+19=50
p帧情况:
如下图所示:
9A 00 = 1001 1010 0000 0000 假设阶数为0,那么leadingZeroBits=0, CodeNum(first_mb_in_slice) = 1-1+0=0
03 29 = 0000 0011 0010 1001 假设阶数为0,那么LeadingZeroBits=6, CodeNum(first_mb_in_slice)=2EXP(6)-2EXP(0)+100101(2进制)=64-1+37=100
原理解说完毕,希望对大家有所帮助。具体计算first_mb_in_slice的代码网上应该比较多,也可以参考ffmpeg的。
h264 ES流文件通过计算first_mb_in_slice区分帧边界
原文地址:http://blog.csdn.net/huanggang982/article/details/37929905