Meta通过在话语级别对语音进行聚类来训练ASR模型

陆旭红
导读 Meta 开发了一种通过在话语级别对语音进行聚类来训练自动语音识别 (ASR) 模型的新方法。顾名思义,ASR 模型用于旨在将口语转录为文本的...

Meta 开发了一种通过在“话语级别”对语音进行聚类来训练自动语音识别 (ASR) 模型的新方法。

顾名思义,ASR 模型用于旨在将口语转录为文本的系统,该文本可用于执行各种功能。ASR 最流行的例子是智能手机助手,例如 Apple 的 Siri、Amazon Echo 或 Google Assistant。

尽管人工智能技术不断进步,但您可能会发现这些助手有时很难理解您的讲话。Meta 旨在改进这种将来自不同种族的各种说话者聚集在一起的方法,而不是根据年龄组或性别等指标训练 ASR 模型的传统数据集。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!