资讯详情

一、常见音频编码格式以及帧长计算

一、音频帧长度

音频帧的概念不如视频帧清晰。一般来说,一帧视频帧可以被视为某种视频编码格式编码后的图像,但音频帧与特定的编码格式有关,例如PCM裸数据不需要音频帧的概念,音频播放只能根据采样率和采样精度进行控制

1.1 音频播放过程

播放时,应用程序从存储介质中读取不同编码格式的音频数据PCM数据发送到音频驱动程序,转换为人耳可识别的模拟音频

录音时,音频驱动不断采样PCM将数据送回应用程序,应用程序完成采样、量化、压缩、存储等任务

二、PCM

假设采样率 48khz,位深16bit,因此,长度计算公式:采样率 x 采样大小 x 声道数为:kb/s,即一秒钟的音频数据需要占据这么多 bit 位存储,也成为码率 例子:帧长 len = 48000 * 16 * 2 / 8 = 192k (Byte)

此外,由于音频数据必须需要传输,一次传输多少字节数据,一秒钟传输多少音频数据包,这些都影响了音频呈现的最终效果:是否卡住?音画同步吗?

例子:发送间隔选择 20ms,那么一秒钟需要发送 1000 / 20 = 由于音频码率为50次, 192k 字节,然后发送音频数据包的大小是 192k / 50 = 3840 字节

三、ADPCM

ADPCM ,即自适应差异脉冲编码调制,是16bit声波数据是一种损坏压缩算法,每次在声流中采样 16bit 数据以 4bit 存储,所以压缩比 1 : 4.优点是算法复杂度低,编解码延迟最短,但声音质量一般,正确PCM有损压缩数据

三、G711.A

G711国际电信联盟ITU-T一套定制的语音压缩标准,主要用脉冲编码调制音频采样,采样率为8khz,压缩率为1:2, 将16位数据压缩成8位

G.711是主流的波形声编解码器,有两种压缩算法,一种是u律,主要用于北美和日本;另一种是a律,主要用于欧洲和世界其他地区。

pcm裸数据经过G711.A编码后,网络传输,包装周期一般分为10ms,20ms,30ms,以20ms为例

如果采样率 48khz,位深16bit,双通道,码率为:48k * 16 * 2 = 192k (Byte),那么20ms的包 = 192k / 1000 * 20 = 3840 字节个pcm因为裸数据G711.A编码压缩率为 2 :1,所以发送一次G711.A音频数据包的大小是 3840 / 2 = 1920 字节

四、G726

G.726可将64kbps的PCM信号转换为40kbps、32kbps、24kbps、16kbps的ADPCM信号。 最常用的方法是 32 kbit/s,由于其只是 G.由于网络的可用空间增加了711速率的一半,G.726算法的本质是ADPCM, 自适应量化算法,64kbit/s 压缩到32kbit/s

五、AAC

AAC,中文名称是高级音频编码,是专门为声音数据设计的文件压缩格式MP不同的是,它采用了一种新的算法来编码,更高效,音质更好

注:采样率为44.1kHz的AAC一帧的解码时间必须控制在23.22毫秒内,通常是按1024个采样点一帧

在这里插入图片描述

标签: p48k5s圆形连接器

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台