为什么谷歌相信机器学习是它的未来

2021-12-23 10:33:31 通良琳

导读本周 Google I O 主题演讲中最有趣的演示之一是今年晚些时候推出的新版 Google 语音助手。一位谷歌员工要求谷歌助手调出她的照片，然

本周 Google I/O 主题演讲中最有趣的演示之一是今年晚些时候推出的新版 Google 语音助手。一位谷歌员工要求谷歌助手调出她的照片，然后展示她与动物的照片。她敲了敲一个说：“把它寄给贾斯汀。” 照片被放入消息应用程序中。

从那以后，事情变得更加令人印象深刻。

“嘿谷歌，给杰西卡发一封电子邮件，”她说。“嗨，杰西卡，我刚从黄石公园回来，完全爱上了它。” 电话转录了她的话，把“嗨杰西卡”放在自己的电话线上。

“以黄石冒险为主题，”她说。助理明白应该把“黄石历险记”放在主题行，而不是正文。

然后，在没有任何明确命令的情况下，女人又开始口述消息的正文。最后她说“发送”，谷歌的助手照做了。

该公司表示，谷歌还在努力扩大助手对个人推荐信的理解。如果用户说，“嘿谷歌，妈妈家的天气怎么样”，谷歌将能够确定“妈妈的家”是指用户母亲的家，查询她的地址，并提供天气预报她的城市。

谷歌表示，其下一代助手将在今年晚些时候推出“新的 Pixel 手机”——即当前 Pixel 3 系列之后的手机。

显然，罐装演示和运输产品之间存在很大差异。我们将不得不等待，看看与新助手的典型交互是否能正常工作。但谷歌似乎正在朝着打造一个虚拟助手的梦想稳步前进，该助手可以通过语音胜任复杂的任务。

I/O 上的很多公告都是这样的：不是发布重大新产品，而是使用机器学习技术逐渐使一系列 Google 产品变得更加复杂和有用。谷歌还吹捧了对其机器学习软件的一些底层改进，这将允许谷歌创建的和第三方软件使用更复杂的机器学习技术。

特别是，谷歌正在大力推动将机器学习操作从云端转移到人们的移动设备上。这应该允许机器学习驱动的应用程序更快、更私密，并且能够离线运行。

谷歌在机器学习方面处于领先地位

如果你问机器学习专家当前深度学习热潮何时开始，许多人会提到 2012 年以主要作者 Alex Krizhevsky 命名的一篇名为“AlexNet”的论文。作者是多伦多大学的三名研究人员，他们参加了 ImageNet 竞赛，将图像分类为一千个类别中的一个。

ImageNet 组织者提供了超过一百万个带标签的示例图像来训练网络。AlexNet 通过使用具有 8 个可训练层和 650,000 个神经元的深度神经网络实现了前所未有的准确性。他们之所以能够在如此庞大的数据上训练如此庞大的网络，是因为他们找到了如何利用专为大规模并行处理而设计的消费级 GPU。

AlexNet 展示了深度学习三足凳的重要性：更好的算法、更多的训练数据和更强的计算能力。在过去的七年里，公司一直在争先恐后地加强他们在这三个方面的能力，从而取得越来越好的业绩。

谷歌几乎从一开始就一直在引领这一潮流。在 AlexNet 在 2012 年赢得名为 ImageNet 的图像识别竞赛两年后，谷歌以更深的神经网络参加了比赛并获得了最高奖项。该公司聘请了数十名顶级机器学习专家，其中包括2014 年收购深度学习初创公司 DeepMind，使公司始终处于神经网络设计的前沿。

该公司还拥有无与伦比的大型数据集访问权限。一个2013文件描述谷歌如何使用深层神经网络在数以千万计的图像通过谷歌街景拍摄的识别地址编号。

谷歌也一直在硬件方面努力工作。2016 年，谷歌宣布它已经创建了一种称为张量处理单元的定制芯片，专门用于加速神经网络使用的运算。

谷歌在 2017 年写道： “尽管谷歌早在 2006 年就考虑为神经网络构建专用集成电路 (ASIC)，但情况在 2013 年变得紧迫。那时我们意识到神经网络的快速增长的计算需求可能需要我们将运营的数据中心数量增加一倍。”

这就是为什么 Google I/O 在过去三年中如此关注机器学习的原因。该公司认为，这些资产——一小群机器学习专家、大量数据和自己的定制芯片——使其成为利用机器学习带来的机会的理想选择。

今年的 Google I/O 实际上并没有发布很多与 ML 相关的主要新产品，因为该公司已经将机器学习融入了其许多主要产品中。多年来，Android 一直拥有语音识别和 Google 智能助理。谷歌相册长期以来一直拥有令人印象深刻的基于机器学习的搜索功能。去年，谷歌推出了谷歌双工，它代表用户进行预订，用软件创建的异常逼真的人声。

相反，关于机器学习的 I/O 演讲侧重于两个领域：将更多的机器学习活动转移到智能手机上，以及使用机器学习来帮助弱势群体——包括聋人、文盲或患有癌症的人。

将机器学习压缩到智能手机上

过去使神经网络更准确的努力包括使它们更深入、更复杂。这种方法产生了令人印象深刻的结果，但它有一个很大的缺点：网络往往过于复杂而无法在智能手机上运行。

人们主要通过将计算卸载到云来解决这个问题。谷歌和苹果语音助手的早期版本会记录音频并将其上传到公司服务器进行处理。这样做没问题，但它有三个明显的缺点：延迟更高，隐私保护较弱，并且该功能只能在线使用。

因此，Google 一直致力于将越来越多的计算转移到设备上。当前的 Android 设备已经具备基本的设备上语音识别功能，但 Google 的虚拟助手需要互联网连接。谷歌表示，这种情况将在今年晚些时候随着谷歌助手的新离线模式而改变。

这种新功能是本周演示所展示的闪电般快速响应时间的一个重要原因。谷歌表示，对于某些任务，该助手的速度将“快 10 倍”。

标签：

免责声明：本文由用户上传，如有侵权请联系删除！