谷歌又推出隐私保护的计算框架——联合分析

2020-7-7 06:32| 发布者:风华正茂| 查看:81| 评论:0

摘要:近期谷歌牵头的联合计算陆续有产出,继联合学习后,联合分析也得到实践。以此发展方向,与谷歌论文中描述的联合计算通用框架的目标又近了一步。
近期谷歌牵头的联合计算陆续有产出,继联合学习后,联合分析也得到实践。以此发展方向,与谷歌论文中描述的联合计算通用框架的目标又近了一步。

对联合分析的第一个探索是支持联合学习:当数据中心中没有可用的数据时,工程师如何根据实际数据衡量联合学习模型的质量?答案是重新使用联合学习基础架构,但没有学习部分。”谷歌研究科学家丹尼尔·拉奇(Daniel Ramage)和软件工程师Stefano Mazzocchi在一份声明中说。“在联合学习中,模型定义不仅可以包括要优化的损失函数,还可以包括代码以计算指示模型预测质量的指标。我们可以使用此代码直接评估手机数据上的模型质量。”

例如,在一项用户研究中,Gboard工程师根据手机上保存的原始打字数据测量了单词预测模型的整体质量。参与研究的电话下载了一个候选模型,在本地计算了该模型的预测与实际键入的单词匹配程度的度量,然后上传了该度量,而无需对模型本身进行任何调整或对Gboard的键入体验进行任何更改。通过平均许多手机上载的指标,工程师了解了模型性能的总体水平摘要。

在另一项研究中,Gboard工程师希望发现用户通常键入的单词,并将其添加到词典中以进行拼写检查和键入建议。他们仅使用在全球词典中还没有在这些电话上键入的单词来训练电话上的字符级循环神经网络。从来没有打字过的单词离开电话,但是可以在数据中心中使用生成的模型来生成频繁键入的字符序列(即新单词)的样本。

除了模型评估之外,Google还使用联合分析在其Pixel手机上支持“正在播放”功能,该功能可显示附近可能正在播放的歌曲。在引擎盖下,“正在播放”可轻敲设备上的歌曲指纹数据库,无需移动网络即可识别手机附近的音乐。

当Google Play识别出一首歌曲时,它会将曲目名称记录到设备上的历史记录中;当手机处于空闲状态且正在通过Wi-Fi进行充电时,Google的联合学习和分析服务器有时会邀请其加入用数百部手机进行计算。该回合中的每部电话都会计算其“正在播放”历史记录中歌曲的识别率,并使用安全的聚合协议对结果进行加密。加密的费率被发送到联合分析服务器,该服务器没有用于单独解密它们的密钥。与本轮其他手机的加密计数结合使用时,服务器可以解密所有歌曲计数的最终计数。

这样的结果使Google的工程师可以改善歌曲数据库,而无需任何电话透露任何歌曲,例如,通过确保数据库中包含真正流行的歌曲。Google声称,在其第一次改进迭代中,联合分析使全球所有Pixel手机的总体歌曲识别率提高了5%。

“我们还在开发技术,以回答分散数据集上甚至更多模棱两可的问题,例如'我的模型难以识别哪些数据模式?”通过训练联合生成模型。我们正在探索应用用户级差分私有模型训练的方法,以进一步确保这些模型不对任何一个用户唯一的信息进行编码。” Ramage和Mazzocchi写道。“联合分析方法仍处于早期阶段,需要以更高的准确性来回答许多常见的数据科学问题。但联合分析使我们能够以不同的方式来考虑数据科学,其中分散的数据和隐私保护聚合发挥中心作用。”

温馨提示:
1、在徽乐论坛里发表的文章仅代表作者本人的观点,与本网站立场无关。
2、徽乐论坛的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3、当政府机关依照法定程序要求披露信息时,论坛均得免责。
4、若因线路及非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5、注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进一步追究其责任的权利。

鲜花

握手

雷人

路过

鸡蛋

最新评论

返回顶部 关注微信 下载APP