AI 平台:http://ai.baidu.com/
开发工具:vs 2017
准备工作
1、注册百度账号
2、登录百度 AI 开发平台,http://ai.baidu.com/
3、在控制台点击“百度语音”服务,点击“创建应用”,填写必填项,勾选额外接口,点击立即创建获取秘钥。在应用列表中查看自己的id
创建自己的项目
1、新建项目
打开 vs2017,点击文件,新建项目,选择 visual C# --> windows 桌面 --> windows 窗体应用,选择自己的项目地址,点击确定
2、添加 baiduai 开发包
点击引用 --> 管理 nuGet 程序包,搜索 baiduai,点击下载
3、UI 设计
直接拖动即可,生成界面如下
4、后台功能实现
private void button1_Click(object sender, EventArgs e) { OpenFileDialog fdlg = new OpenFileDialog(); fdlg.Title = "C# Corner Open File Dialog"; //fdlg.InitialDirectory = @"c:/"; //@是取消转义字符的意思 //fdlg.Filter = "All files(*.*)|*.*|All files(*.*)|*.* "; ///* // * FilterIndex 属性用于选择了何种文件类型,缺省设置为0,系统取Filter属性设置第一项 // * ,相当于FilterIndex 属性设置为1.如果你编了3个文件类型,当FilterIndex =2时是指第2个. // */ fdlg.FilterIndex = 2; ///* // *如果值为false,那么下一次选择文件的初始目录是上一次你选择的那个目录, // *不固定;如果值为true,每次打开这个对话框初始目录不随你的选择而改变,是固定的 // */ //fdlg.RestoreDirectory = true; if (fdlg.ShowDialog() == DialogResult.OK) { //textBox1.Text = System.IO.Path.GetFileNameWithoutExtension(fdlg.FileName); filePath.Text = System.IO.Path.GetFullPath(fdlg.FileName); } }
// 语音合成按钮 private void button2_Click(object sender, EventArgs e) { string value = this.videoType.Text; String filePath = this.filePath.Text; // 设置APPID/AK/SK String APP_ID = "14433392"; String API_KEY = "C7WMYgLeWv3Wm2yogwv5gD08"; String SECRET_KEY = "xcvwiwikALBDBaIcGisNQ6aQImtj3qua"; var client = new Asr(APP_ID, API_KEY, SECRET_KEY); client.Timeout = 60000; // 修改超时时间 client.Timeout = 120000; // 若语音较长,建议设置更大的超时时间. ms FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read); byte[] buffur = new byte[fs.Length]; try { fs.Read(buffur, 0, (int)fs.Length); } catch (Exception ex) { Console.Write(ex.StackTrace); } finally { if (fs != null) { //关闭资源 fs.Close(); } } var result = client.Recognize(buffur, value, 16000); Convert.ToString(result); JToken resultStr = null; result.TryGetValue("result", out resultStr); Console.WriteLine("aToken===>"+ resultStr); voiceResult.Text = Convert.ToString(resultStr); Console.Write(result); }
调用 api 中 C# SDK 的语音合成 api
https://ai.baidu.com/docs#/ASR-Online-Csharp-SDK/top
// 开始合成按钮(语音合成功能) private void synthesisButton_Click(object sender, EventArgs e) { String APP_ID = "14433392"; String API_KEY = "C7WMYgLeWv3Wm2yogwv5gD08"; String SECRET_KEY = "xcvwiwikALBDBaIcGisNQ6aQImtj3qua"; // 获取输入框的值 String value = this.Speech_Synthesis.Text; // 将 value 转成语音文件存放到本地 var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY); // 可选参数 var option = new Dictionary<string, object>() { {"spd", 5}, // 语速 {"vol", 7}, // 音量 {"per", 3} // 发音人,4:情感度丫丫童声 }; var result = client.Synthesis(value, option); try { if (result.ErrorCode == 0) { // 或 result.Success File.WriteAllBytes("E:/prepared/北航/07_工程实践--AI方向/作业/WindowsFormsApplication1/WindowsFormsApplication1/tmp.mp3", result.Data); } } catch (Exception ex) { Console.Write(ex.StackTrace); } Play(); }
源码地址:https://github.com/zhongsb/vo...
以上就是c# 开发语音识别程序的详细内容,更多关于c# 语音识别的资料请关注小牛知识库其它相关文章!
由于连接到不同的API,我目前正在开发一个工具,允许我阅读所有的通知。 它工作得很好,但现在我想用一些声音命令来做一些动作。 就像当软件说“一封来自Bob的邮件”时,我想说“阅读”或“存档”。 我的软件是通过一个节点服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。 在NodeJS中,启用语音到文本的最佳方式是什么? 我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我希望在一
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产
识别简单的语句。
光环板内置的麦克风和Wi-Fi功能相结合,可以实现语音识别相关的应用。通过接入互联网,可以使用各大主流科技公司提供的语音识别服务,像是微软语音识别服务。使用联网功能需要登陆慧编程账号。 注册/登陆慧编程 点击工具栏右侧的登陆/注册按钮,依据提示登陆/注册账号。 启用上传模式 点击启用上传模式。 新建语音识别项目 我们将新建一个语音识别项目,使用语音来点亮光环板的LED灯。 连接网络 1. 添加事件
1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. HTTP API 接入参考Demo 1.1.5. 协议概述 1.1. ASR(语音识别) HTTP接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)Http接口协议,面向想要了解ASR细节,并具有一定开发能力的开发者或用户。 1.1.2. 服务
1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 1.1.2. 服务地址 1.1.3. 协议详解 1.1.4. 协议地址 1.1.5. 协议概述 1.1.6. ASR 云端一些细节 1.1. ASR(语音识别) WebSocket接口文档 1.1.1. 概述 本文档目的是描述Rokid云ASR(语音识别)WebSocket接口协议,面向想要了解ASR细节,并具有一定开发