跳到主要内容
2,458问题
筛选依据
排序依据
标记为
1 投票
1 回答
42 意见

颤抖语音到文本[关闭]

我目前在较新的Android版本(33+)上面临speech_to_text包的问题。最近的Android更新增加了限制,取消了对多种语言的支持。我需要捕捉。。。
Mahim Khan的用户头像
0 投票
0 答案
13 意见

Azure或Google Speech SDK-与Azure注释板和动态字典等效的功能?

Azure文本对文本转换器有一种机制,可以将源文本中的某些短语标记为“不翻译”,并且还有一个动态字典来指定特定于语言的。。。
Ennova的用户头像
0 投票
1 回答
31 意见

Azure语音转文本-自动检测语言不工作

我正在使用NextJS进行一个项目,在这个项目中,我需要使用语言检测实现连续语音到文本。虽然我已经成功地为一种语言设置了语音到文本,但我正在努力。。。
乔亚克的用户头像
0 投票
1 回答
49 意见

SFSpeechRecognitionResult在长时间暂停时丢弃以前的抄本

我遇到了这个帖子中描述的同样的问题。由于iOS 18,当我使用SFSpeechAudioBufferRecognitionRequest时,返回的不是之前丢弃的最终SFSpeehRecognitionResult。。。
罗伯特·德雷斯勒的用户头像
0 投票
0 答案
49 意见

错误(Xcode):“SpeechToTextPlugin”在不同的模块中有不同的定义;

昨天我把Mac升级到了红杉和XCode 16,从此我再也无法构建Flutter应用程序了。我收到了一堆错误消息,导致我升级了所有的软件包,重新安装了可可荚。。。
生物降解土豆芯片的用户头像
0 投票
0 答案
51 意见

通过谷歌语音到文本获取歌曲歌词

在我的Nodejs服务器中,我使用谷歌的语音到文本API来获取歌曲的歌词,但它似乎与音乐不太协调。我漏掉了大部分单词,所以我的问题是,这个api与。。。
Armen Sanoyan的用户头像
0 投票
0 答案
25 意见

Google Cloud Speech-to-Text API返回状态代码400,仅提供requestId和totalBilledTime

我正在尝试使用Google Cloud Speech-to-Text API将音频数据转换为文本。然而,当我发送请求时,总是收到状态代码400错误。此外,转换结果仅。。。
okome omochi的用户头像
0 投票
1 回答
31 意见

android、RecognizerIntent。EXTRA_LANGUAGE_PREFERENCE在语音对文本中不起作用

突然间,我的语音转文本应用程序不起作用了。它仍然是英语(英国)。对话框上的语言未更改。我打开了完整的源代码。。。
DriveWelly的用户头像
0 投票
0 答案
22 意见

Azure AI机器学习工作室因快速窃窃私语而崩溃

所以我尝试在Azure AI机器学习工作室中运行更快的耳语。代码是来自的示例代码https://github.com/SYSTRAN/faster-sleep在我的笔记本电脑上运行良好(只有CPU而不是GPU)。。。
Tensing2009用户头像
0 投票
0 答案
26 意见

将文本作为流发送到Gemini API

我正在构建一个应用程序,它可以进行语音到文本的谷歌云语音到文本,然后使用Gemini-flash LLM进行文本翻译。我接收来自speech-to-text API的文本作为块,其中。。。
MohamedLEGH的用户头像
0 投票
0 答案
27 意见

新Speech Studio自定义关键字模型的无休止处理

我对Azure和Speech Studio很陌生。无论如何,我按照文档创建了一个新的自定义关键字(模型类型“basic”)。根据文件,这将需要“最多30。。。
亚历山德罗的用户头像
0 投票
0 答案
34 意见

在Nextjs中使用虚拟麦克风-我可以实时转录我听到的内容吗?

我目前正在开发一个Nextjs应用程序,它可以实时转录系统音频中的音频数据。在此处输入图像描述作为mac用户,我使用BlackHole进行环回。而我。。。
Nicholas Cheung的用户头像
0 投票
0 答案
44 意见

团队实时语音翻译插件

我希望构建一个用于实时语音翻译的Microsoft Teams插件。要求如下:该插件应访问Microsoft团队会议的音频流。提供实时。。。
Amit的用户头像
0 投票
1 回答
35 意见

speechRecognitionLanguage zh-CN识别NOMATCH

我使用WebSocket接收浏览器捕获的音频流数据。如果我使用默认英语,一切看起来都很好,但当我尝试切换语言时,它几乎无法识别任何单词。这个。。。
顾的用户头像
  • 78
0 投票
0 答案
15 意见

反应-语音-识别库中是否有类似waitTime的参数?

我正在使用反应语音识别进行语音到文本。我希望我的代码只在用户连续3秒没有说话时停止侦听。目前,只要用户。。。
Aditya Singh Rathore的用户头像

15 30 50 每页
1
2 4 5
164