微软推出了一款名为WhiteNoise的人工智能隐私工具

钱炎瑗
导读 在本周举行的Build 2020开发者大会上,微软宣布为Azure机器学习添加新功能。Azure machine learning是一个基于云的环境,用于训练

在本周举行的Build 2020开发者大会上,微软宣布为Azure机器学习添加新功能。Azure machine learning是一个基于云的环境,用于训练、部署和管理人工智能模型。WhiteNoise是一个针对不同隐私的工具包,现在可以在Azure或者GitHub的开源平台上使用。它增加了新的人工智能解释和公平性工具,以及新的数据、模型和实验访问控制;细粒度可追溯性和血统的新技术;新的机密机器学习产品;和新的工作流责任文档。

这一努力是微软朝着更容易解释、更安全、更“公平”的人工智能系统努力的一部分。研究表明,面部识别系统存在广泛的偏见。比如人工智能有隐私问题,因为很多模型不能使用加密数据。除了今天发布的Azure机器学习功能,微软也在试图解决这些问题和其他挑战,包括人工智能偏见检测工具,减少偏见错误的内部努力,人工智能道德检查表,以及为追求人工智能提供建议的委员会(Aether)。此外,微软副总裁埃里克博伊德(Eric Boyd)表示,Xbox、Bing、Azure和微软365部门的团队都参与了今天上午发布的一些工具包的开发,并亲自使用。

“企业现在正在研究如何开发易于解释和遵守法规(如非歧视和隐私法规)的人工智能应用。”博伊德在接受VentureBeat的电话采访时表示,“他们需要与这些人工智能模型相结合的工具,以便更容易地解释、理解、保护和控制数据和模型。”“我们相信我们对待人工智能的方式是不同的。它基于深入研究的坚实基础,采用深思熟虑的方法,并致力于开源。”

WhiteNoise Toolkit是与哈佛定量社会科学研究所和工程学院的研究人员合作开发的。它利用不同的隐私,使人们能够从数据中获得洞察力,同时保护个人信息(如姓名或出生日期)。通常,差分隐私需要在原始数据中注入一点噪声,然后输入到本地机器学习模型中,这使得恶意行为者很难从训练好的模型中提取原始文件。如果观察者看到了一个算法的输出,但不知道它的计算中是否使用了特定个体的信息,那么这个算法就可以视为差分私有。

WhiteNoise通过库中不同的私有算法和发布机制,以及api、analysis和verifier定义的分析和评估,提供可扩展的隐私保护查询和统计,计算数据隐私的总损失。微软表示,它可以让一组医院合作,建立一个更好的癌症治疗疗效预测模型。例如,与此同时,它有助于遵守法律要求,保护医院信息的隐私,并确保不会从模型中泄露任何个人患者数据。

由微软人工智能和工程研究伦理委员会(Aether)支持的另一个工具包Fairlearn将于6月与Azure machine learning整合,旨在评估人工智能系统的公平性,减轻算法中任何不公平的问题。在仪表盘中,Fairlearn定义了人工智能系统是否对人做了不公平的行为,主要关注两个危害:分发危害和服务质量危害。当人工智能系统扩大或保留机会、资源或信息时,分配将被破坏——例如,在招聘、入学和贷款中。服务质量风险是指一个系统对一个人是否和对另一个人一样有效,即使没有机会、资源或信息被扩展或保留。

Fairlearn遵循一种称为“群体权益”的方法,旨在找出哪些群体的个人有受到伤害的风险。数据科学家指定工具包中的相关群体(例如性别、肤色和种族),这些群体是特定于应用的;群体公平通过一组约束形式化,要求人工智能系统的某些方面(或多个方面)的行为在群体之间具有可比性。

据微软称,安永会计师事务所;专业服务公司YoungYoung Fairlearn用于评估模型输出在性别方面的公平性。工具包显示,男性和女性的积极贷款决定相差15.3%。然后,Young的建模团队开发并训练了几个校正模型,并可视化了公平性和模型准确性之间的常见权衡。该团队最终得到了一个最终模型,该模型优化并保留了整体准确性,但将男女差异缩小到了0.43%。

在新的工具包列表中,最后一个是paraphrase ml,它最早出现在去年的alpha中,但在今天的Azure机器学习中也可以使用。Expltml结合了许多机器学习解释技术,通过可视化模型的行为和预测背后的推理来帮助解释。它可以推荐在任何给定用例中对模型最重要的参数(或变量),并可以解释为什么这些参数是重要的。

博伊德说:“我们希望通过Azure机器学习为我们的客户提供这项服务,帮助他们理解和解释他们的模型发生了什么。”“(这些工具包),我们认为我们已经给了开发人员很大的权力来真正理解他们的模型,他们可以看到他们的可解释性[和]公平性,并开始理解其他参数不满足于以不同的方式做出预测或摆动模型。”

标签:

免责声明:本文由用户上传,如有侵权请联系删除!