iOS: аудиоформат для записи голосового кодирования для передачи по сети
Я ищу хороший аудиоформат для локального сохранения голосовых записей и для передачи по сети. Требования:
- Достойное качество. Эти клипы, при получении, будут прослушаны много раз
- Рабочий процесс должен поддерживать обрезку и выцветание перед транспортировкой
- Достойный размер файла
Это мой текущий подход к записи:
// SEE IMA4 vs M4A http://stackru.com/questions/3509921/recorder-works-on-iphone-3gs-but-not-on-iphone-3g
NSDictionary *recordSettings =
[[NSDictionary alloc] initWithObjectsAndKeys:
[NSNumber numberWithFloat: 11025], AVSampleRateKey,
[NSNumber numberWithInt: kAudioFormatLinearPCM], AVFormatIDKey,
[NSNumber numberWithInt: 1], AVNumberOfChannelsKey,
[NSNumber numberWithBool:NO], AVLinearPCMIsFloatKey,
[NSNumber numberWithInt: AVAudioQualityMax], AVEncoderAudioQualityKey,
nil];
NSError *error = nil;
self.audioRecorder = [[ AVAudioRecorder alloc] initWithURL:self.recordingFile settings:recordSettings error:&error];
И подход для кодирования:
NSString *file = [NSString stringWithFormat:@"recordingConverted%x.caf", arc4random()];
self.filePath = [NSTemporaryDirectory() stringByAppendingPathComponent: file];
NSFileManager *fileManager = [NSFileManager defaultManager];
if ([fileManager fileExistsAtPath:self.filePath]) {
NSError *error;
if ([fileManager removeItemAtPath:self.filePath error:&error] == NO) {
NSLog(@"removeItemAtPath %@ error:%@", self.filePath, error);
}
}
NSLog(@"IN: %@", self.recordingFile);
NSLog(@"OUT: %@", self.filePath);
AVAsset *avAsset = [AVAsset assetWithURL:self.recordingFile];
// get the first audio track
NSArray *tracks = [avAsset tracksWithMediaType:AVMediaTypeAudio];
if ([tracks count] == 0) return nil;
AVAssetTrack *track = [tracks objectAtIndex:0];
// create the export session
// no need for a retain here, the session will be retained by the
// completion handler since it is referenced there
AVAssetExportSession *exportSession = [AVAssetExportSession
exportSessionWithAsset:avAsset
presetName:AVAssetExportPresetAppleM4A];
if (nil == exportSession) return nil;
// create trim time range
CMTime startTime = CMTimeMake(self.speakingBeginTime*44100, 44100);
CMTime stopTime = CMTimeMake((self.speakingBeginTime+[self.duration doubleValue])*44100, 44100);
CMTimeRange exportTimeRange = CMTimeRangeFromTimeToTime(startTime, stopTime);
// create fade in time range
CMTime startFadeInTime = startTime;
CMTime endFadeInTime = CMTimeMake((self.speakingBeginTime+RECORDING_INTERVAL)*1.5*44100, 44100);
CMTimeRange fadeInTimeRange = CMTimeRangeFromTimeToTime(startFadeInTime,
endFadeInTime);
// setup audio mix
AVMutableAudioMix *exportAudioMix = [AVMutableAudioMix audioMix];
AVMutableAudioMixInputParameters *exportAudioMixInputParameters =
[AVMutableAudioMixInputParameters audioMixInputParametersWithTrack:track];
[exportAudioMixInputParameters setVolumeRampFromStartVolume:0.0 toEndVolume:1.0
timeRange:fadeInTimeRange];
exportAudioMix.inputParameters = [NSArray
arrayWithObject:exportAudioMixInputParameters];
// configure export session output with all our parameters
exportSession.outputURL = [NSURL fileURLWithPath:self.filePath]; // output path
exportSession.outputFileType = AVFileTypeAppleM4A; // output file type
exportSession.timeRange = exportTimeRange; // trim time range
exportSession.audioMix = exportAudioMix; // fade in audio mix
// MAKE THE EXPORT SYNCHRONOUS
dispatch_semaphore_t semaphore = dispatch_semaphore_create(0);
[exportSession exportAsynchronouslyWithCompletionHandler:^{
dispatch_semaphore_signal(semaphore);
}];
dispatch_semaphore_wait(semaphore, DISPATCH_TIME_FOREVER);
dispatch_release(semaphore);
if (AVAssetExportSessionStatusCompleted == exportSession.status) {
return self.filePath;
//NSLog(@"AVAssetExportSessionStatusCompleted");
} else if (AVAssetExportSessionStatusFailed == exportSession.status) {
// a failure may happen because of an event out of your control
// for example, an interruption like a phone call comming in
// make sure and handle this case appropriately
NSLog(@"AVAssetExportSessionStatusFailed %@", exportSession.error.localizedDescription);
} else {
NSLog(@"Export Session Status: %d", exportSession.status);
}
В настоящее время производительность 3-секундного аудиоклипа составляет 62 228 байт для PCM и 36 654 байт для кодированных. Похоже, я мог бы сделать лучше.
1 ответ
Я нашел руководство здесь:
http://gamua.com/blog/2010/06/sound-on-ios-best-practices/
быть полезным при выборе звуковых форматов (особенно комментариев)
Здесь также есть несколько хороших примеров:
Как записать звук на iPhone с помощью AVAudioRecorder?
особенно пример с различными форматами для экспорта, и этот ответ:
/questions/20741765/kak-zapisat-zvuk-na-iphone-s-pomoschyu-avaudiorecorder/20741788#20741788
что значительно уменьшило размер файла.