FAAC是一个MPEG-4和MPEG-2的AAC编码器,其特性是:可移植性好,快速,支持LC/Main/LTP,通过Dream支持DRM,代码小相对于FFMPEG的AAC转码,FAAC实在是微乎其微,而且可以直接把代码加到工程里面编译,也可使用静态库,而没有巨大的动态库的烦恼。
static uint8_t* inputBuffer = NULL; //输入信息缓冲区
static faacEncHandle hEncoder; // PCM 音频 FAAC 编码器
//目前声道数上限默认为1,除非去修改 MAX_CHANNELS 参数,不过修改该参数会极大限度增高内存消耗
static unsigned long nSampleRate = 8000; // 采样率
static uint8_t nChannels = 1; // 声道数
static uint8_t nPCMBitSize = 16; // 单样本位数
//以下3个参数由FAAC初始化API接口自动赋值
static unsigned long nInputSamples = 0; //输入样本个数, 需要进行编码的 PCM 音频样本个数
static unsigned long nMaxOutputBytes = 0; // FAAC 编码器最多一次可以接收的样本个数
static int inputBufferSize = 0; //输入缓存区的大小
// inputBufferSize = nInputSamples * nPCMBitSize / 8;
//输入缓存区的大小=输入样本个数*单样本位数/8
faacEncHandle FAACAPI faacEncOpen(unsigned long sampleRate,
unsigned int numChannels,
unsigned long *inputSamples,
unsigned long *maxOutputBytes)
//faacEncHandle 返回值 : FAAC 音频编码器
//unsigned long sampleRate 参数 : 音频采样率
//unsigned int numChannels 参数 : 音频通道参数
//unsigned long *mInputSamples 参数 : 输入样本个数, 需要进行编码的 PCM 音频样本个数(FAAC 编码器最多一次可以接收的样本个数)
//unsigned long *mMaxOutputBytes 参数 : 输出数据最大字节数
faacEncConfigurationPtr FAACAPI faacEncGetCurrentConfiguration(faacEncHandle hEncoder)
// hEncoder : faacEncOpen返回的编码器句柄
注:下面只对部分参数进行说明解释,具体其他设置参数详细可以参考:
https://blog.csdn.net/qinglongzhan/article/details/81315532
/*
PCM Sample Input Format
0 FAAC_INPUT_NULL invalid, signifies a misconfigured config
1 FAAC_INPUT_16BIT native endian 16bit
2 FAAC_INPUT_24BIT native endian 24bit in 24 bits (not implemented)
3 FAAC_INPUT_32BIT native endian 24bit in 32 bits (DEFAULT)
4 FAAC_INPUT_FLOAT 32bit floating point
*/
pConfiguration->inputFormat = FAAC_INPUT_16BIT;
/*
设置 AAC 编码规格, 有 9 种
MPEG-2 AAC LC低复杂度规格(Low Complexity), MPEG-2 AAC Main主规格, MPEG-2 AAC SSR可变采样率规格(Scaleable Sample Rate)
MPEG-4 AAC LC低复杂度规格(Low Complexity), MPEG-4 AAC Main主规格, MPEG-4 AAC SSR可变采样率规格(Scaleable Sample Rate)
MPEG-4 AAC LTP长时期预测规格(Long Term Predicition), MPEG-4 AAC LD低延迟规格(Low Delay), MPEG-4 AAC HE高效率规格(High Efficiency)
这里选择低复杂度规格, 可选参数有 4 种
MPEG-4 AAC LC低复杂度规格(Low Complexity) 是最常用的 AAC 编码规格, 即兼顾了编码效率, 有保证了音质;
使用更高音质, 极大降低编码效率, 音质提升效果有限
再提升编码效率, 会使音质降低很多
*/
pConfiguration->aacObjectType = LOW;
//AAC品质(50-100:影响大小,50以下:基本都差不多)
pConfiguration->quantqual = 100;
/*
AAC 音频文件有两种格式 ADIF 和 ADTS
AAC 文件解码时 : 音频解码信息定义在头部, 后续音频数据解码按照音频数据长度
音频数据交换格式 ( Audio Data Interchange Format ) , 只有一份音频解码信息 , 存储在文件开头
这种格式适合存储音频文件 , 节省空间 , 但是必须从开始播放才可以 , 从中间位置无法播放 ;
音频数据传输流格式 ( Audio Data Transport Stream ) , 每隔一段音频数据
就会有一份音频解码信息 , 这种格式适合音频流传输 , 可以在任何位置开始解码播放 ;
RTMP 推流时, 不使用上述两种格式
推流视频时, 先将 SPS, PPS 解码数据包的信息推流到服务器上
推流音频时, 也是将解码相关的数据先推流到服务器中
AAC 编码时, 会编码成 ADTS 数据
但是推流音频时, 推流的是 AAC 裸数据, 需要将 ADTS 音频格式中的头信息去掉
这里设置输出格式 0, 就是 FAAC 将 PCM 采样进行编码, 编码出的格式是 AAC 原始数据
即没有解码信息的 ADIF 和 ADTS 的 AAC 纯样本裸数据
*/
//注:这里配置最好为1,带上ADTS头,否则无法播放
pConfiguration->outputFormat = 1;
int FAACAPI faacEncSetConfiguration(faacEncHandle hEncoder,
faacEncConfigurationPtr config)
// hEncoder : faacEncOpen返回的编码器句柄
// config : 编码器的配置信息
基本流程说明:从驱动线程采集录音数据—》推送至主线程进行打包—》推送至网络线程进行网络推流—》通过FFPLAY进行拉流播放
修改相应的录音配置参数,采集足够的PCM纯裸流数据,进行FAAC转换为AAC数据。
将录音数据推送至主线程进行数据处理打包。
在主线程将已经打包好的数据发到网络线程,进行网络数据推流到服务器后,即可通过FFPLAY到服务器进行拉流播放了。
注意:需要加上推流异常处理机制和对应的缓存空间进行缓存,避免当网络链接出现短暂异常后,数据丢失的情况。
ffplay播放器的操作步骤:
具体操作方法可参考链接:https://www.jianshu.com/p/c7d644be780e
补充一下:如果没有对应的服务器协助联调的话,可以尝试以下流程也能在本地进行调试:
m=audio "本地电脑的端口" RTP/AVP 97
a=rtpmap:97 mpeg4-generic/8000/1
a=fmtp:97 SizeLength=13;
c=IN IP4 "本地电脑的IP"
具体的RTP协议包格式这里就不做描述了,具体可以参考以下链接:
RTP协议连接
参考链接: