Android RakNet 系列之三移植Portaudio

浏览数：36 / 时间：2015年06月11日

简介

PortAudio 是一个跨平台采集和播放音频的开源库，不过尚未支持Android平台，笔者决定让PortAudio支持Android。
Android上，处理音频的库是OpenSL ES，从API 9开始支持的技术，通过这个标准，Android已经完全可以在native层采集和播放音频。
换句话说，PortAudio支持Android，也就是支持OpenSL ES。

详情

Opensl es

penSL ES 是无授权费、跨平台、针对嵌入式系统精心优化的硬件音频加速API。它为嵌入式移动多媒体设备上的本地应用程序开发者提供标准化, 高性能,低响应时间的音频
功能实现方法，并实现软/硬件音频性能的直接跨平台部署，降低执行难度，促进高级音频市场的发展。

实现

Android Opensl es 实现可以直接通过官方的Demo了解。官方的demo提供了音频采集、音频缓存播放、音频url播放、音频文件播放、调整混合音效等等功能。

函数如下：

////////////////////////////////////////音频播放器操作
static int CreateAudioPlayer(SLObjectItf *playerObject, SLEngineItf engine, SLObjectItf mix, int numChannels, double sampleRate, PaSampleFormat sampleFormat );//建立音频
static int OpenAudioPlayer(PaOpenSLESStream* stream,unsigned long framesPerBuffer,PaSampleFormat outputSampleFormat);//打开音频播放器
static int SetAudioPlayerVolum(PaOpenSLESStream* stream,int millibel); //设置音频声量
static int PushAudioPlayerQueue(PaOpenSLESStream* stream);//向音频播放器输入数据
static int StartAudioPlayer(PaOpenSLESStream* stream);//开始音频
static int CloseAudioPlayer(PaOpenSLESStream* stream);//关闭音频
static int SetAudioPlayerMuteSolo(PaOpenSLESStream* stream,int chan,int muteSolo);//操作MuteSolo
///////////////////////////////////////麦克风操作
static int CreateAudioRecorder(SLObjectItf *recorderObject, SLEngineItf engine,int numChannels, double sampleRate, PaSampleFormat sampleFormat);
static int OpenAudioRecorder(PaOpenSLESStream* stream,unsigned long framesPerBuffer,PaSampleFormat inputSampleFormat);//打开麦克风
static int CloseAudioRecorder(PaOpenSLESStream* stream);//关闭麦克风
static int StartAudioRecorder(PaOpenSLESStream* stream);//开始麦克风
static int PopAudioRecorderQueue(PaOpenSLESStream* stream);//向音频播放器取出数据

PortAudio Opensl es实现

实现机制如下--------音频采集缓存、音频播放缓存然后回调实现数据处理便可。

代码按源码pa_hostapi_skeleton.c模版实现便可。

回调如下：

static int c_callback(const void *inputBuffer, void *outputBuffer, unsigned long framesPerBuffer,
	const PaStreamCallbackTimeInfo* outTime, const PaStreamCallbackFlags statusFlags, void *userData)

音频元素

涉及音频的元素挺多，记录如下：

OpenSLES 中
typedef struct SLDataFormat_PCM_ {	
SLuint32 		formatType;
	数据格式定义 SL_DATAFORMAT_PCM
SLuint32 		numChannels;
	声道个数（跟channelMask 一致）
SLuint32 		samplesPerSec;
	每秒采集频率 hz
SLuint32 		bitsPerSample;
	采样比特（采样格式）
SLuint32 		containerSize;
	包含大小
SLuint32 		channelMask;
	通道面具//立体声、左声道、右声道
SLuint32		endianness;
	块的字节顺序 从16--32位
} SLDataFormat_PCM;

GUID-----
SL_IID_VOLUME  音量
SL_IID_PLAY  播放控制
SL_IID_BUFFERQUEUE  缓存接口
SL_IID_EFFECTSEND  音效
SL_IID_MUTESOLO   静音
SL_IID_RECORD  录音接口
SL_IID_PLAYBACKRATE 采样率控制
SL_IID_EQUALIZER 均衡器
SL_IID_PRESETREVERB 预设混响
SL_IID_ENVIRONMENTALREVERB 环境混响
SL_IID_3DLOCATION  3D定位
SL_IID_3DDOPPLER  多普勒效应
SL_IID_BASSBOOST  低音增强
SL_IID_PITCH     升降调
SL_IID_VIRTUALIZER  虚拟化
……

采集频率：音频的采样频率，每秒钟能够采样的次数，采样率越高，音质越高。给出的实例是44100、22050、11025但不限于这几个参数。例如要采集低质量的音频就可以使
用4000、8000等。

量化位数（数据位数）：采样值或取样值，用来衡量声音波动变化的一个参数，也可以说是声卡的分辨率。
1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了。

比特率：它描述了单位时间长度的媒体内容需要空间。每秒的传输速率。

声道：声音的通道的数目。常有单声道和立体声之分。

帧：单位时间内媒体帧的个数，其长度为样本长度(采样位数)和通道数的乘积。

数据量：采集数据需要的缓冲区的大小
数据量（字节每秒） = 采集频率 * 量化位数 * 声道数 / 8（字节） = 帧 * 字节

周期：音频设备一次处理所需要的帧数，对于音频设备的数据访问以及音频数据的存储，都是以此为单位。

交错模式：数字音频信号存储的方式。数据以连续帧的方式存放，即首先记录帧1的左声道样本和右声道样本，再开始帧2的记录...，

非交错模式：首先记录的是一个周期内所有帧的左声道样本，再记录所有右声道样本。