目前正在搞一个IM的APP,内部好友之间可以发送语音,需要长按实现语音转文字的功能,之前使用的是阿里的NUI.framework,但是这个破玩意,经常出现转出来的文字重复,即使了多声道控制都无法处理掉,体验太差。没办法,就决定替换为apple自己的实现,毕竟siri那么强大!此实现包含本地音频及远程音频,你只需要按时数据model保存对应的path即可,内部会自动识别。
现在来看看实现条件:
在
Info.plist
里面添加两个键值对:
1、Privacy - Speech Recognition Usage Description
(用于请求语音识别)2、
Privacy - Microphone Usage Description
(用于请求麦克风语音输入授权)。并给出相应的文字描述。
导入库文件:
#import <Speech/Speech.h>
以下为实现头文件及逻辑文件:
头文件: NSVoice2Text.h
// // NSVoice2Text.h // 语音转文字 // // Created by wise on 2021/10/13. // #import