一、音频帧长度

音频帧的概念不如视频帧清晰。一般来说，一帧视频帧可以被视为某种视频编码格式编码后的图像，但音频帧与特定的编码格式有关，例如PCM裸数据不需要音频帧的概念，音频播放只能根据采样率和采样精度进行控制

1.1 音频播放过程

播放时，应用程序从存储介质中读取不同编码格式的音频数据PCM数据发送到音频驱动程序，转换为人耳可识别的模拟音频

录音时，音频驱动不断采样PCM将数据送回应用程序，应用程序完成采样、量化、压缩、存储等任务

二、PCM

假设采样率 48khz，位深16bit，因此，长度计算公式：采样率 x 采样大小 x 声道数为：kb/s，即一秒钟的音频数据需要占据这么多 bit 位存储，也成为码率例子：帧长 len = 48000 * 16 * 2 / 8 = 192k （Byte）

此外，由于音频数据必须需要传输，一次传输多少字节数据，一秒钟传输多少音频数据包，这些都影响了音频呈现的最终效果：是否卡住？音画同步吗？

例子：发送间隔选择 20ms，那么一秒钟需要发送 1000 / 20 = 由于音频码率为50次， 192k 字节，然后发送音频数据包的大小是 192k / 50 = 3840 字节

三、ADPCM

ADPCM ，即自适应差异脉冲编码调制，是16bit声波数据是一种损坏压缩算法，每次在声流中采样 16bit 数据以 4bit 存储，所以压缩比 1 : 4.优点是算法复杂度低，编解码延迟最短，但声音质量一般，正确PCM有损压缩数据

三、G711.A

G711国际电信联盟ITU-T一套定制的语音压缩标准，主要用脉冲编码调制音频采样，采样率为8khz，压缩率为1：2，将16位数据压缩成8位

G.711是主流的波形声编解码器，有两种压缩算法，一种是u律，主要用于北美和日本；另一种是a律，主要用于欧洲和世界其他地区。

pcm裸数据经过G711.A编码后，网络传输，包装周期一般分为10ms，20ms，30ms，以20ms为例

如果采样率 48khz，位深16bit，双通道，码率为:48k * 16 * 2 = 192k （Byte），那么20ms的包 = 192k / 1000 * 20 = 3840 字节个pcm因为裸数据G711.A编码压缩率为 2 ：1，所以发送一次G711.A音频数据包的大小是 3840 / 2 = 1920 字节

四、G726

G.726可将64kbps的PCM信号转换为40kbps、32kbps、24kbps、16kbps的ADPCM信号。最常用的方法是 32 kbit/s，由于其只是 G.由于网络的可用空间增加了711速率的一半，G.726算法的本质是ADPCM，自适应量化算法，64kbit/s 压缩到32kbit/s

五、AAC

AAC，中文名称是高级音频编码，是专门为声音数据设计的文件压缩格式MP不同的是，它采用了一种新的算法来编码，更高效，音质更好

注：采样率为44.1kHz的AAC一帧的解码时间必须控制在23.22毫秒内，通常是按1024个采样点一帧

资讯详情

一、常见音频编码格式以及帧长计算

一、音频帧长度

1.1 音频播放过程

二、PCM

三、ADPCM

三、G711.A

四、G726

五、AAC

动力学技术KTU1121 USB Type-C 端口保护器的介绍、特性、及应用

一、常见音频编码格式以及帧长计算

最近热搜

历史搜索 清除历史记录

历史搜索清除历史记录