微软推出虚拟麦克风阵列的谈话转录

童筠若
导读 微软在本周的Build 2019主题演讲中展示了智能会议的一些有趣进展。公司官员展示了一种新的对话转录功能,这是Azure语音服务的一部分。现在

微软在本周的Build 2019主题演讲中展示了智能会议的一些有趣进展。公司官员展示了一种新的对话转录功能,这是Azure语音服务的一部分。现在处于预览状态的新功能允许通过自动发言者存档来实时转录多用户对话——即使在交叉对话发生时。

但今年Build 2019演示的另一部分发生得太快了,以至于许多人(包括我)可能一开始都没有注意到:微软表示,这项服务不仅适用于其定制的麦克风阵列参考硬件——像去年一样构建——而是使用了由云供电的虚拟麦克风阵列。

虚拟/云计算仍然是微软的一个研究项目,代号为“丹麦项目”。Project Denmark不再依赖专用麦克风阵列,而是允许用户使用普通麦克风等手机和笔记本电脑等消费类设备来设置“虚拟”麦克风阵列。它符合微软不断发展的环境计算战略。

丹麦研究人员表示,“多层次结合语音信息的算法可以产生接近近距离麦克风的转录精度。”研究网站有一个新的项目网页,以及一份关于丹麦的技术报告。

今年的Build发布是从微软研究院的博文中介绍的:

“丹麦的项目可以使用Azure语音服务来帮助我们的客户随时随地更轻松地转录对话,无论是否有专用的麦克风阵列DD K。未来的应用场景非常广泛。例如,我们可能会将多个微软翻译应用程序配对,以帮助多人更有效地用手机进行交流,从而最大限度地减少语言障碍。”

本周,微软宣布将制造神秘的圆形麦克风阵列硬件。我们第一次在Build 2018上以设备开发套件(代号“普林斯顿大楼”)的形式提供给公司的外部人员。只有音频麦克风阵列DD K可以从http://ddk.roobo.com购买,价格约100美元的高级视听麦克风阵列DD K可以从微软系统集成合作伙伴处获得。

voice developer suite专为那些想要为定制虚拟助理、对话转录和智能扬声器构建设备的人而设计。(Azure Kinect开发者套件还可以处理对话转录,它的价值。)

在Build 2018中,微软宣布正在开发单一的语音应用程序编程接口(API)和软件开发工具包(SDK),可以在其产品和服务中运行,包括Windows、Office、Cortana、Xbox和HoloLens。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!