问题：

Android语音到文本：：实时更新文本

益富

2023-03-14

我想在我的应用程序中转换语音到文本...对于这个，我正在使用识别监听器界面一切正常，但如何更新和显示文本，即使说话（像在谷歌现在语音搜索）

我已经设置了识别意图。EXTRA_PARTIAL_RESULTS，为真，并且还使用了识别监听器界面的onPARAL结果（Bundle arg（）方法来设置文本通过语音识别完成后立即显示整个文本，但是我希望实时文本在用户说话时显示

我的活动

public class MainActivity extends Activity implements RecognitionListener
{
private TextView returnedText;
private ToggleButton toggleButton;
private ProgressBar progressBar;
private SpeechRecognizer speech = null;
private Intent recognizerIntent;
private String LOG_TAG = "VoiceRecognitionActivity";

@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.main);
    returnedText = (TextView) findViewById(R.id.textView1);
    progressBar = (ProgressBar) findViewById(R.id.progressBar1);
    toggleButton = (ToggleButton) findViewById(R.id.toggleButton1);
    Button recordbtn = (Button) findViewById(R.id.mainButton);


    progressBar.setVisibility(View.INVISIBLE);
    speech = SpeechRecognizer.createSpeechRecognizer(this);
    speech.setRecognitionListener(this);
    recognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
    recognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE,
                              "en");
    recognizerIntent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,
                              this.getPackageName());
    recognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,
                              RecognizerIntent.LANGUAGE_MODEL_WEB_SEARCH);
    recognizerIntent.putExtra(RecognizerIntent.EXTRA_PARTIAL_RESULTS, true);
    recognizerIntent.putExtra(RecognizerIntent.EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS, 3000);

    toggleButton.setOnCheckedChangeListener(new OnCheckedChangeListener() {

            @Override
            public void onCheckedChanged(CompoundButton buttonView,
                                         boolean isChecked) {
                if (isChecked) {
                    progressBar.setVisibility(View.VISIBLE);
                    progressBar.setIndeterminate(true);
                    speech.startListening(recognizerIntent);
                } else {
                    progressBar.setIndeterminate(false);
                    progressBar.setVisibility(View.INVISIBLE);
                    speech.stopListening();
                }
            }
        });


    recordbtn.setOnLongClickListener(new OnLongClickListener(){

            @Override
            public boolean onLongClick(View p1)
            {
                progressBar.setVisibility(View.VISIBLE);
                progressBar.setIndeterminate(true);
                speech.startListening(recognizerIntent);
                return true;
            }


        });



}

@Override
public void onResume() {
    super.onResume();
}

@Override
protected void onPause() {
    super.onPause();
    if (speech != null) {
        speech.destroy();
        Log.i(LOG_TAG, "destroy");
    }

}

@Override
public void onBeginningOfSpeech() {
    Log.i(LOG_TAG, "onBeginningOfSpeech");
    progressBar.setIndeterminate(false);
    progressBar.setMax(10);
}

@Override
public void onBufferReceived(byte[] buffer) {
    Log.i(LOG_TAG, "onBufferReceived: " + buffer);
}

@Override
public void onEndOfSpeech() {
    Log.i(LOG_TAG, "onEndOfSpeech");
    progressBar.setIndeterminate(true);
    toggleButton.setChecked(false);
}

@Override
public void onError(int errorCode) {
    String errorMessage = getErrorText(errorCode);
    Log.d(LOG_TAG, "FAILED " + errorMessage);
    returnedText.setText(errorMessage);
    toggleButton.setChecked(false);
}

@Override
public void onEvent(int arg0, Bundle arg1) {
    Log.i(LOG_TAG, "onEvent");
}

@Override
public void onPartialResults(Bundle arg0) {
    Log.i(LOG_TAG, "onPartialResults");

    ArrayList<String> matches = arg0.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION);
    String text = "";
    for (String result : matches)
        text += result + "\n";

    returnedText.setText(text);
}

@Override
public void onReadyForSpeech(Bundle arg0) {
    Log.i(LOG_TAG, "onReadyForSpeech");
}

@Override
public void onResults(Bundle results) {
    Log.i(LOG_TAG, "onResults");

}

@Override
public void onRmsChanged(float rmsdB) {
    Log.i(LOG_TAG, "onRmsChanged: " + rmsdB);
    progressBar.setProgress((int) rmsdB);

}

public static String getErrorText(int errorCode) {
    String message;
    switch (errorCode) {
        case SpeechRecognizer.ERROR_AUDIO:
            message = "Audio recording error";
            break;
        case SpeechRecognizer.ERROR_CLIENT:
            message = "Client side error";
            break;
        case SpeechRecognizer.ERROR_INSUFFICIENT_PERMISSIONS:
            message = "Insufficient permissions";
            break;
        case SpeechRecognizer.ERROR_NETWORK:
            message = "Network error";
            break;
        case SpeechRecognizer.ERROR_NETWORK_TIMEOUT:
            message = "Network timeout";
            break;
        case SpeechRecognizer.ERROR_NO_MATCH:
            message = "No match";
            break;
        case SpeechRecognizer.ERROR_RECOGNIZER_BUSY:
            message = "RecognitionService busy";
            break;
        case SpeechRecognizer.ERROR_SERVER:
            message = "error from server";
            break;
        case SpeechRecognizer.ERROR_SPEECH_TIMEOUT:
            message = "No speech input";
            break;
        default:
            message = "Didn't understand, please try again.";
            break;
    }
    return message;
}

}

怎么让这一切发生

共有1个答案

荆炳

2023-03-14

你无法用谷歌API实现实时识别。在最佳情况下，当您使用OK google或Whatsup中的识别功能逐字书写文本时，您可以获得与google相同的结果，从而增加您的意图：

recognizerIntent.putExtra("android.speech.extra.DICTATION_MODE", true);

语音识别器会花时间处理所有信息，并将其拆分为信息，以便在应用程序中使用。你可以查看下一篇帖子，看看它是否有助于你优化你的应用程序：让SpeechRecognizer更快

希望对你有帮助！

类似资料：

Android语音到文本示例

我已经查看了语音识别的Android示例，但我并不真正了解它应该做什么或它是如何工作的。在清单中没有任何类型的主要活动要运行，因此当我在手机上安装该应用程序时，我无法运行它。我还试图找到一个简单的语音到文本的示例，它将语音作为输入并在屏幕上输出文本。这样我就可以研究它来看看它是如何工作的，但是我在网上找不到任何展示它的示例。
谷歌语音到文本api android

Android谷歌语音转文本SDK，语音录制由SDK控制。我需要将其设置为手动按钮，用于启动和停止语音录制，以便将语音转换为文本。例如：当单击按钮开始语音识别时，它会继续录制音频，直到单击停止按钮。但在android SDK中，它会自动停止录制并将录制的音频传递给处理。
语音到文本api其他语言android

问题内容：我开发了可以识别普通话语音，然后生成文本的android应用程序。但是我找不到怎么做。有人可以给我示例其他语言（普通话，法国等）的语音识别代码吗？问题答案：您可以在调用识别器时设置RecognizerIntent.EXTRA_LANGUAGE。因此，简体中文的示例为：
AVSpeechSynthesizer文本到语音

带有en-us语音的AVSpeechsynthesizer是“A”的发音，是“大写字母A”，但只想要“A”，怎么能做到呢？
Android语音到文本Api Google-通知

我跟着这首短裙：https://jbinformatique.com/2018/02/16/android-speech-to-text-api-google-tutoriel/ 它工作得很好！它使用android.speech.识别意图包，它是免费的，它可以在没有互联网的情况下工作，正如这里提到的： Android语音到文本API（识别器意图）和Google Cloud Speech API之间
语音到文本大型音频文件[Microsoft语音API]

使用Microsoft语音API转录中/大型音频文件（每个文件约6-10分钟）的最佳方式是什么？比如批量音频文件转录？我使用了https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-to-text-sample中提供的代码，用于连续转录语音，但它在某个时候停止转录。转录有任何限制吗？我只使用免

Android语音到文本：：实时更新文本

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档