示例·实现广告投放模型的优化。在数字广告场景,如果广告主所持有的广告转化数据能够被广告平台的投放模型所利用去优化广告投放模型,那么无疑会提高投放模型的推荐费用。
这种推荐效应一旦得到提升之后,不仅用户本身的打扰和信息荣誉可能会大大减少,而且也能提高整体的经济效益。所以其实具有非常高的应用价值。传统的技术条件下如果要实现将广告主所掌握的转化、数据提供给广告投放平台去做训练,可能意味着原文的个人信息的传输,按照个人信息保护法的要求传输构成个人信息的提供行为,需要用户的单独同意。
但是实操当中基于诸多原因的限制,这种同意可能往往并不能够实现。在隐私计算技术的支持下这种状况有望得到改变,图中介绍了一种模式去做这样的数据处理。计算过程中首先需要在广告投放平台以及广告主自己本地的环境当中去部署学习的平台,当然其中包含了原始的广告投放模型的算法,在计算开始的时候需要双方各自在本地去输入自己持有的用户信息。
广告投放平台输入的是用户的特征,广告主可能需要输入的是历史用户的转化结果,是否在广告当中完成了转化技术的支持下,双方交互的数据可以看到箭头上的数据,首先是有用户对齐,基于psi技术去做id的对齐。然后是根据模型所用模型的差异会涉及到泛白点,也就说向量数据的对齐以及梯度模型数据的对齐。
通过这张表来看看具体涉及的数据以及所具有的保障措施,最终来看是否是避免了个人信息的提供行为?首先来看还是用户求救的环节。刚才也讲到利用了psi技术,保护了非交际用户的id不被泄露。
当广告注册输入的id本身在有敏感信息时,比方说讲广告本身可能是特殊人群的用品时,那么广告投放平台还要采取全量化标识输入的方式去避免被复制广告注册的敏感用户数据集,这个时候去用这种模式来去实现对广告注册用户数据及关联信息的保护。
刚才的例子当中,双方分别有输入用户的特征和用户的转化结果,也就是说标签信息,但是这样的输入实际上只在双方的本地进行计算,并没有处于双方的本地环境。真正发生交互的是下方这里看到的含量数据和梯度数据在技术上,实际上已经被处理为了有原始数据含义的特征符号。这种特征符号虽然目前并没有发现能够被逆向解读的情形,不论是人工还是机器没有发现逆向解读的情形。
但是为了确保符合匿名化的要求,仍然建议采用安全多方计算、查分隐私等技术,对这两类数据进行保密进行保护,所以用这样的一个技术方案用这样的数据保护方式来避免了原始的个人信息直接从广告组流动到广告投放平台。