我们知道为了获得更好的动态范围,除了常见的8bit yuv外,还有10bit,16bit这样的yuv数据。8bit的yuv数据还好理解,每一个像素8bit,在内存中自然也就是一个字节一个字节的存储咯,16bit的也类似,每一个像素对应两个字节,在内存中存起来也非常方便,那么10bit呢?
在不做任何调查的情况下,我们可以凭直觉猜想有两种存储方式:
1.每个像素依然占用16bit两个字节,但是其中6个bit是padding,补0
2.每个像素实打实地占用10bit,各个像素交织在一起,没法整齐地分布在字节中
第一种方式便于运算处理,但是有存储冗余,第二种方式则没有冗余,但是计算起来就很麻烦了。事实上,10bit是采用第一种方式存储在内存中的,也就是说,为了高动态范围,牺牲了一点压缩效率,但也获得了运算性能的加成,大概就是多媒体技术里无处不在的trade off了。
下面来详细说说是如何存储的,并且以实例进行验证。
参考这里的文档:
10-bit and 16-bit YUV Video Formats
可以得知10bit yuv数据在内存中的存储格式如下图所示
而8bit像素数据是如何转换为10bit像素数据的呢,根据SMPTE 274M标准,就是乘上一个系数2^(n-8),这里的n就是位深,也就是10或者16,所以如果要把8bit yuv数据转成10bit,就是乘4,即左移两位。
下面验证一下:
使用如下命令将8bit yuv转为10bit
ffmpeg -s 240x120 -i test.yuv -pix_fmt yuv420p10be test10.yuv
1
这里的yuv420p10be即10bit yuv420p 大端 格式。各种像素格式可以用如下命令列出
ffmpeg -pix_fmts
1
首先我们发现的一件有意思的事情就是原来的test.yuv文件大小为1055KB,转出来的test10.yuv的大小正好是它的2倍,2110KB。验证了每像素16bit的说法。
再用UltraEdit看看每个像素的2进制数据
在test.yuv中的第一个Y的2进制数据如下
1001 0010
1
在test10.yuv中对应的样点的2进制数据如下
0000 0010 0100 1000
1
可以看到,在原来的基础上左移两位,后面补上两个0,这是实际的10bit数据,前面再补上6个0,是padding位