(此文纯属心得分享,无科普,并假设读者了解CMS和RAPPOR。如有错误,恳请指出)
一直感觉差分隐私和纯粹概率有点不同的地方,看完苹果的CMS基本算法和谷歌的RAPPOR基本算法,感觉其实都是一回事。
比如CMS对独热向量的每一位按照 1/(1+e^(Epsilon/2)) 的概率进行翻转,最后达到隐私预算为Epsilon的差分隐私框架要求;RAPPOR采用随机应答的思想,有 1/2f 的概率置为1,有 1/2f 的概率置为0,有 1-f 的概率保持不变(其实就是以 1/2f 的概率进行翻转)最后达到隐私预算为 2Ln((1-1/2f)/(1/2f)) 的差分隐私框架要求(假设布隆过滤器的哈希函数个数为1)。
换算一下可以得出两者其实就是将独热向量的每一位以p的概率进行翻转,达到的隐私保护效果就是 2Ln((1-p)/p)。