三亚新闻网
国际新闻 当前位置:首页 > 国际新闻 > 正文

谷歌开源Live Transcribe语音识别转文字工具

Moonlight Blog 2011.8.18我想分享

谷歌在其开源博客 Live Transcribe的语音引擎中宣布开源Android语音识别转录工具,该引擎可以将语音或对话实时转录为文本,并且还可以帮助听障人士。

Live Transcribe是谷歌今年2月推出的Android应用程序。它的语音识别由Google最先进的Cloud Speech API提供。但是,依赖云会带来一些复杂性,不断变化的网络连接,数据成本和延迟都会带来一些挑战。因此,谷歌开源并希望开发人员在现有基础上构建和开发它。

Cloud Speech API目前不支持无限制的音频流,团队已采取措施解决这一难题,例如在达到超时之前关闭并重新启动流请求,这有效地减少了会话中丢失的文本量。

值得一提的是,Live Transcribe支持70多种语言,并可自动识别基于语音的语言,包括中文。

另外,由于提供了实时语音转录,转录的文本将随着语音的输入而改变,并且必须减少延迟。凭借其定制的Opus编码器,该引擎可以大大减少延迟。

收集报告投诉

谷歌在其开源博客 Live Transcribe的语音引擎中宣布开源Android语音识别转录工具,该引擎可以将语音或对话实时转录为文本,并且还可以帮助听障人士。

Live Transcribe是谷歌今年2月推出的Android应用程序。它的语音识别由Google最先进的Cloud Speech API提供。但是,依赖云会带来一些复杂性,不断变化的网络连接,数据成本和延迟都会带来一些挑战。因此,谷歌开源并希望开发人员在现有基础上构建和开发它。

Cloud Speech API目前不支持无限制的音频流,团队已采取措施解决这一难题,例如在达到超时之前关闭并重新启动流请求,这有效地减少了会话中丢失的文本量。

值得一提的是,Live Transcribe支持70多种语言,并可自动识别基于语音的语言,包括中文。

另外,由于提供了实时语音转录,转录的文本将随着语音的输入而改变,并且必须减少延迟。凭借其定制的Opus编码器,该引擎可以大大减少延迟。

——



三亚新闻网 版权所有© www.jb-xfoto.com 技术支持:三亚新闻网 | 网站地图