我想在我的Android应用程序中添加一个语音界面。两个要求:
>
我只需要在任何时候从一个小字典中识别单词——基本上是屏幕上的任何可点击元素,并且大多数可点击元素已经有文本,所以从字面上看就是“说你看到的”。
在应用程序可见的情况下进行连续语音识别,尽管我可以忍受在演讲之前说“Ok app”。
实现这一点的最佳方式是什么?
谢谢NickB
如果你想要离线的东西,我会看看PocketSphinx(https://cmusphinx.github.io/wiki/tutorialandroid/)。我用它来离线唤醒词识别。它似乎更容易接受你说的话,而不是更少。
要持续收听,您可以查看IBM的Watson的Speech to Text软件(https://github.com/watson-developer-cloud/android-sdk),这是一种基于语音到文本的云。
我能够将两者结合起来,使用PocketSphinx检测唤醒词,然后使用Watson获得良好的语音到文本结果。
我有一个工作应用程序,我想添加语音命令。当前应用程序定期(定时器)通过蓝牙来回传输数据。用户可以按按钮和NumberPickers来修改通过蓝牙发送的数据。还有从蓝牙链接接收到的数据,并显示在文本视图中。此应用程序目前工作正常。 我想做的是添加语音命令功能,以便用户可以选择按下按钮/数字选择器,或者可以仅使用语音命令更改值。 我测试了一些可以在各种网站上找到的从语音到文本的例子。我成功地测试了一个
我正在尝试在我的Android应用程序中实现继续语音识别。我已经遵循了这个链接编码。这个继续语音识别在两天前工作。但是现在语音识别工作不好,它将需要更多的时间进行语音监听。如何解决这个问题。请指导我。谢谢 识别编码: 用户开始说话
如何使用REST API(带javascript SDK)Bing语音API实现连续语音识别? 使用do Javascript SDK示例:https://github.com/Microsoft/Cognitive-Speech-STT-JavaScript只能用麦克风转录短句
我有一个实现识别侦听器(RecognitionListener)的活动。要使其连续,每次我再次启动侦听器时: 但是,它需要一些时间(大约半秒钟)才能开始,所以有半秒钟的间隙,没有人在听。因此,我怀念那段时差中所说的话。 另一方面,当我使用谷歌的语音输入时,代替键盘来口述消息——这个时间间隔不存在。意思是——有一个解决方案。 这是什么? 谢谢
我想在我的应用程序中引入一项新功能:永久语音识别。 首先,我关注以下帖子: 语音识别 Android中的语音识别 Android离线语音识别(JellyBean) 还有更多其他人,还有来自不同网站的其他帖子。 问题:实际上,我想做的是在不显示谷歌语音活动的情况下获得永久性的语音识别。例如:当我启动应用程序时,语音识别应该启动并收听。当识别器匹配一些单词时,我的应用程序将相应地执行不同的操作。我不喜
我正在从事一个关于“家庭自动化”系统的项目,该系统使用Android应用程序和微控制器,通过蓝牙模块将它们连接起来。我已经将“语音到文本”合并到语音命令中。尽管如此,它与内置的谷歌语音识别api配合得很好。我所需要的只是一个连续的语音识别,而不需要谷歌语音弹出窗口。我在playstore“speechnotes”上看到了一个类似的应用程序,这正是我想要开发的。它完全离线工作。