Meta通过在话语级别对语音进行聚类来训练ASR模型

2023-08-11 10:03:54 来源：编辑：陆旭红

Meta 开发了一种通过在“话语级别”对语音进行聚类来训练自动语音识别 (ASR) 模型的新方法。

顾名思义，ASR 模型用于旨在将口语转录为文本的系统，该文本可用于执行各种功能。ASR 最流行的例子是智能手机助手，例如 Apple 的 Siri、Amazon Echo 或 Google Assistant。

尽管人工智能技术不断进步，但您可能会发现这些助手有时很难理解您的讲话。Meta 旨在改进这种将来自不同种族的各种说话者聚集在一起的方法，而不是根据年龄组或性别等指标训练 ASR 模型的传统数据集。

标签：

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！