150 likes | 264 Views
基于位置服务中的连续查询隐私保护研究. 中国人民大学. 潘晓 郝兴 孟小峰. introduction. …. …. Range query. Shortest path query. Nearest-neighbor query. Hospital Hotel Gas station. Hospital. (id, loc, query). (id’, Rec , query). Hotel. Gas station. 动机. 位置服务中现有的隐私保护工作均针对 snapshot 查询 类型
E N D
基于位置服务中的连续查询隐私保护研究 中国人民大学 潘晓 郝兴孟小峰
introduction … … Range query Shortest path query Nearest-neighbor query Hospital Hotel Gas station Hospital (id, loc, query) (id’, Rec, query) Hotel Gas station
动机 • 位置服务中现有的隐私保护工作均针对snapshot查询类型 • 如果将现有的匿名算法直接应用于连续查询隐私保护将产生隐私泄露的现象. {A,B,D}∩{A,B,F}∩{A,C,F}={A} 用户A的查询隐私泄露
最简单的方法 位置隐私泄露 糟糕的服务质量 • 目标 • 如何在频繁位置更新的前提下,在查询有效期内既保护用户的隐私,包括位置隐私和查询隐私,又提供最高的服务质量?
Outline • 引言& 动机 • 相关工作 • 预备知识 • 隐私模型 • 贪心匿名算法 • 实验结果 • 结论
相关工作 • 位置隐私保护和查询隐私保护是移动计算环境中主要考虑的两个隐私问题 • 位置匿名的基本思想分为三种 • 发布假位置 • 时空匿名 • 加密 • [1]首次提出了连续查询隐私保护问题 • 指出将用户在初始时刻形成的匿名集作为查询有效期内的最终结果,从而解决连续查询隐私泄露的问题。 [1] C. Chow and M. F. Mokbel. Enabling privacy continuous queries for revealed user locations. In Proceedings of the International Symposium on Advances in Spatial and Temporal Databases (SSTD), 2007
预备知识 (Lx+,t,Ly+,t) • 位置扭曲度(Distortion) • 总信息扭曲度 • 时序相似度 (Lx-,t,Ly-,t) 时序相似度越相小,匿名集的信息扭曲度就业越小。 其中maxT=max(O1.Texp,O2.Texp)
x Rti O3 Rtj WB O2 O1 Tw t 隐私模型 • 隐私 • 服务质量 ! ! Rti Rtj δp-隐私模型: 对于任意的时刻t∈[Ts, maxT], min(WBt,HBt)≥δp*PA δq-质量模型: 对于任意的时刻t∈[Ts,maxT], Q∈CR,
贪心匿名算法 • 依次扫描待查询集合RSet中待匿名且并未过期的查询。 • 判断如果这两个查询形成匿名集,是否满足δq-质量模型。 • 如果满足,则计算这两个查询时序相似度,将r与具有最小相似度的查询聚集在一起。 • 如果不满足,则取下一个查询。 • 重复上述过程,直至包含该查询的候选匿名集从RSet再也找不到合并的查询。 • 最后,如果候选匿名集的大小大于隐私度k,则判断该候选集是否满足δp-隐私模型。
边界对象的计算 • 用一个队列BTQ记录候选匿名集在有效期内所有的边界对象. • 追踪所有对象的运动进而获得所有时刻的边界对象是不现实的,代价很昂贵 • 假设对象匀速运动,则其每一个对像的运动可以以一个线性函数来表示. • 仅计算对边界有影响的交叉点位置。
质量与隐私检验 • δq-质量模型检测 • 对于BTQ中任意两个连续时刻点 ti,ti+1 , 设PA=Aheight+Awidth, PL,t=Lx+,t-Lx-,t+Ly+,t-Ly-,t, Pv,t=vx+,t-vx-,t+vy+,t-vy-,t,对任意时刻 t∈[ti, ti+1], • δp-隐私模型检测 • 取出其BTQ中两个连续时刻ti,ti+1, 计算候选匿名框的宽和高,分别判断是否大于Δp=δp*min(Awidth,Aheight)。 WBt=Lx+,t-Lx-,t=(Lx+,ti-1-Lx-,ti-1)+(vx+,t-vx-,t)×(t-ti-1) HBt=Ly+,t-Ly-,t=(Ly+,ti-1-Ly-,ti-1)+(vy+,t-vy-,t)×(t-ti-1)
实验结果与分析 • 实验采用著名的Thomas Brinkhoff路网数据生成器,以城市Oldenburg的交通路网作为输入,生成模拟数据。 • 实验参数及默认取值 5
实验结果与分析(续) • 实验评测了匿名成功率、匿名时间、处理时间和平均匿名代价随着隐私度(k)增加的变化情况。
结论与未来工作 • 阐述了现有的静态匿名算法不适用于连续查询隐私保护,产生查询隐私泄露等问题。 • 提出了δp-隐私模型和δq-质量模型均衡隐私保护与服务质量 • 基于提出的隐私模型,提出了贪心匿名算法。 • 贪心算法在隐私度很大时,匿名时间和处理时间成指数集增长,寻找更高效的匿名算法。