基于自动协商的社交网用户隐私保护机制研究

2014-03-20 11:13颜丽君刘晓青

楚雄师范学院学报 2014年3期

颜丽君，刘晓青

(楚雄师范学院信息科学与技术学院，云南楚雄 675000)

1 引言

随着web2.0的出现，各种社交网络SNS(Social Network Service)迅猛发展。［1］社交网络为网络用户的交流带来了方便性和快捷性，但与此同时，社交网络用户信息隐私安全隐患伴随而至。通过社交网络收集和利用用户隐私信息变得更加容易，因此社交网络中用户的隐私安全正成为一个必须解决的问题。［2］

现有的社交网采用了基于web站点的隐私保护技术——隐私偏好设置，即社交网给出相应的隐私策略设置选项，用户根据个人偏好对其进行选择，这种隐私技术可以在一定程度上保护用户的隐私安全，但是它存在着一定的不足。比如隐私策略单一，用户处于被动地位，需手工设置，工作量大等。

针对上述隐私偏好设置存在的问题，本文提出了一种基于自动协商的社交网络用户信息隐私保护机制。此模型中采用了Agent技术，加入协商［3］的概念，采用Pareto遗传算法，实现隐私策略结果的多样性，体现了用户的主动性，简化了工作量。

2 社交网隐私自动协商模型

社交网隐私自动协商模型中考虑了用户的主动性，改变了用户只能选择社交网提出的隐私策略方案，而不能提出自己的想法的被动情形。如果社交网的隐私策略不能满足用户的偏好，则用户可以提出自己的隐私偏好与社交网隐私策略进行协商，以达到双赢。

本文给出了基于双边多议题的协商模型，其中的双边指社交网与用户两端，多议题是对隐私安全保护中主要的问题进行协商，比如信息公开对象，保存时间，用途等议题。因为人工完成协商的工作量很大，为了提高工作效率，，本文采用了Agent技术。

2.1 社交网隐私协商模型的形式化描述

本文用一个六元组［4］来表示双边多议题形式化协商模型:

M=＜Ag，Z，S，W，U，N ＞，其中:

Ag:参与协商过程的Agent集合，Agi∈Agent，其中Agi可以表示协商过程中的所有参与方，在社交网隐私自动协商中i∈ (a，b)，其中Aga表示社交网隐私Agent，Agb表示用户隐私Agent。

Z:协商主题的集合Z={Z1，Z2，…Zj}，其中zj是表示第j个协商主题，本文中是基于双边的多议题协商模型，议题数表示Agi对主题 j的值，值域为Di

S:协商策略的集合，协商过程中根据协商的发展变化而制定的对策和方法。

W:协商议题的权重集，表示不同Agent对于同一主题不同的关注度。其中表示Agi对于第j个主题的权重，其中j∈ {1，2，…，j}，i∈ (a，b)。权重是一个可变的量，会随目标不同有所改变。

U:Agent的效用函数集合U={Ua，Ub}，分别表示社交网和用户的效用函数，其效用函数为主题Zj的评分函数，j∈ {1，2，…，j}。比如:用户认为个人信息比分享重要，则可以用不同的效用值来表明，每一个参数代表的效用值的具体大小与信息的重要性有关，本文设置的最大效用值为10。

N:协商次数。为了防止协商无休止的进行，可以规定协商的最大协商次数，如果超过此协商次数仍没有达成一致，则协商结束。

2.2 基于Agent的社交网隐私协商的体系结构

社交网隐私Agent协商体系结构主要由隐私条件和约束生成器、隐私协商策略、提议评估器、反提议生成器四个部分组成。用户隐私Agent与社交网隐私Agent进行交互、完成提议和反提议，直到达成一致或协商失败。

图1 Agent隐私协商的体系结构

隐私条件和约束生成器根据用户和社交网端的隐私文件，创建用户和社交网网站使用的隐私偏好和隐私策略。提议评估器对其进行约束检查，如其不满足约束条件则用反提议生成器在参照隐私协商策略给出的减弱规则情况下生成一条新的反提议，并交予提议评估器继续评估，直到满足协商结束条件时结束协商。

3 社交网隐私自动协商协议

社交网隐私自动协商协议是规定社交网隐私Agent与用户隐私Agent之间协商所应遵守的准则。

3.1 协商协议模型

社交网隐私协商协议为社交网和用户两个参与方的Agent制定了共同遵循的规则和约束条件。保证协商按照相应时序正确的执行，其协商协议的模型如图2所示:

图2 社交网隐私协商协议模型

3.2 协商协议初始化

在社交网隐私协商协议中，用户隐私Agent和社交网隐私Agent需要规定某一些能让协商正常执行的元组数据，比如，为了让协商可以终止，需要对双方规定具有相同大小的N值即协商最大次数;需要提供协商需要的相关数据，比如说隐私偏好、隐私策略、权重等。其用户隐私A-gent和社交网隐私Agent初始化的相关数据如表1所示:

表1 协商协议初始化数据

4 社交网隐私自动协商算法

社交网隐私自动协商为社交网和用户提供一个双方都满意的隐私策略，需要相应的自动协商算法。

本文主要采用的自动协商算法是Pareto遗传算法，将Pareto最优解与遗传算法相结合。主要包括五大要素:参数编码，初始群体的设定，适应度函数的设计，遗传操作的设计和控制参数的设定。［5］

4.1 编码

在本文中采用遗传算法［6］的大字符集编码，即除给予字符集 {0，1}的二进制编码外，可以结合实际问题的特征采用D进制数或字符集来表示长度为L的位串。

社交网隐私协商的议题主要是信息公开对象，信息用途，保存时间等，其中信息公开对象用x表示、保持时间用t表示、用途用y表示、提醒时间用j表示。其编码结果如表2所示:

表2 议题与遗传算法编码对应表

4.2 目标函数

目标函数表示社交网隐私自动协商的最终目的。在本文的自动协商过程中采用Pareto遗传算法，即针对社交网和用户双方的Agent的隐私协商问题，找到一个Pareto解能使其用户和社交网站点都能达到最大的满意度，社交网隐私自动协商中Pareto目标函数为:

fitness(Agb)代表社交网用户的满意度代表社交网站点的满意度，其中表示Agi对议题j的权重，其中j∈ {1，2，…，N}，i∈ (a，b)，μj表示议题j对应的效益值。效用值越高则安全性越高，效用值越低则安全性越弱，本文中最高的效用值为10，最低的为0，对于每个议题的每个选项的效用值设置如表3所示:

表3 议题选项效用值设置清单

4.3 种群规模

种群即群体，在遗传算法中，种群规模会直接影响算法的性能和效率［7］，种群规模可以根据实际情况在10到200之间选定，本文的隐私自动协商模型群体规模选取20。

4.4 基本操作

遗传算法可以实现优胜劣汰的选择。而要实现种群的优胜劣汰则必须进行相应的基本操作:选择 (selection)、交叉 (Crossover)和变异 (Mutation)。本文设置选择概率Ps为0.9，交叉概率Pc为0.5，变异概率Pm=0.01.

4.5 终止条件

遗传算法终止条件是表示算法运行结束的条件，在社交网隐私自动协商过程中，为了避免协商的无限循环，本文规定了协商的最大次数N，当协商达到最大次数或协商成功的情况下将退出整个协商过程

4.6 权重向量

权重表示社交网和用户对于协商议题的重视度。对于信息公开对象、保持时间、用途、提醒时间四个协商议题的权重，社交网用w_server表示，用户用w_client表示，权重之和都为10。

5 仿真实验及分析

本文用MATLAB 2013对社交网隐私自动协商模型进行了仿真实验。在协商之初，社交网站点将自己的隐私策略传送给社交网隐私Agent，并设置最小期望值60，即如果用户给出的提议计算出的适应度大于等于此期望值，则社交网可以接受用户的提议;用户将自己的隐私偏好传送给用户隐私Agent，并设置最大让步值65，即如果社交网提出的提议的适应度小于等于最大让步值，则用户可以接受该提议。如果对方的提议不在自己可以接受的范围内，则拒绝提议，用采用Pareto遗传算法产生一个对于双方都相对最优的提议，再对此协议进行协商。如此循环，直到超过最大协商次数N或协商成功，则表示协商结束。

在本实验中，假设对于社交网站点而言，信息公开对象、保持时间、用途、提醒时间四个协商议题的权重w_server为 (3，3，3，1)。权重越大，表示此议题对于社交网站点来说更重要。不同的用户有不同的偏好，他们的偏好同样可以用权重来表示，同样，权重越大表示此项对于用户越重要。不同的用户隐私偏好与同一社交网的隐私策略协商结果会不同，即多样性。实验数据如表4所示:

表4 实验数据 (选择算子=0.9)(不同用户与同一社交网)

如表中第一个用户所设定的隐私偏好为 (3，3，2，2)，协商结果为5011，由表2可知从左到右其含义为:5代表信息公开对象为同爱好的人可见，0代表保存时间为不保存，1代表用途为教育研究，1代表提醒时间1个季度，由表3所知，5011分别所代表的效用值为 (3，10，6，6)则根据函数即3×3+3×10+2×6+2×6=63。为此用户计算出的最大让步值为63小于65则用户接受提议。

假设同一用户的隐私偏好设置相同，但因各社交网提供的隐私策略不一致，也会产生不同的协商结果即协商结果具有多样性。实验数据如表5所示:

表5 实验数据 (同一用户与不同社交网)

除了不同用户与同一社交网，同一用户与不同社交网协商结果具有多样性以外，同一个用户与同一个社交网进行隐私自动协商结果也具有多样性。因为Pareto遗传算法求的是近似最优解，且在遗传算法中具有多个近似最优解，因此协商的结果具有多样性。如表6所示，在表中还可以看出第一个协商结果与第二个协商结果对于社交网的期望值是一样的，但对于用户的让步值却不相同，原因是每个议题所代表的效用值不相同。

表6 实验数据 (同一用户与同一社交网)

图3 协商次数与协商时间趋势图

此外，从表4，5，6中显示的协商所需时间可得:协商时间较小，且在协商过程中，随着协商次数的增加协商时间增加幅度都相对平缓，相差的幅度＜0.01s。证明了该模型在时间上的可行性。其具体协商次数与协商所需时间之间的关系如图3所示。

6 结束语

本文结合Agent和协商的概念提出了一种基于Agent的社交网隐私自动协商模型。在该模型中采用了社交网协商协议模型，和Pareto遗传算法作为协商算法。在模型中考虑到了用户的主动性，融入了提醒机制，更好的保护用户隐私安全。但是该模型中的协商算法本身还有一些问题存在，比如遗传算法的早熟现象，本文所用的提醒机制是通过协商中的提醒时间来表示，过于简单，所以对遗传算法的改进和提醒机制的全面化是今后可以努力的方向。

［1］韦伟，李杨，张为群.一种基于GSNPP算法的社交网络隐私保护方法研究［J］.计算机科学，2013，39(3):104—106.

［2］邱均平，李艳红.社交网络中用户隐私安全问题探究［J］.情报资料工作，2012，(6):34—38.

［3］马彦.基于Agent的自动协商技术研究［D］.甘肃:兰州大学.2008:6—8.

［4］蔡莉，颜丽君.基于遗传算法的隐私自动协商机制研究［C］.International conference on internet Technology and Applications 2010.

［5］李敏强，寇纪凇，李丹等.遗传算法的基本理论与应用［M］.北京:科学出版社，2002.

［6］周明，孙树栋.遗传算法原理及应用［M］.北京:国防工业品出版社，2005.

［7］Rosenchein J S，Zlotkin G.Rulers of Encounter:Designing Conventions for Automated Negotiation among Computers［M］.MIT Press，Cambridge，MA，1994.