1、 学校代码基于网络分析的微博用户特性研究 疌生姓名 叠歪蓬学 科究湖南师范大学学位评定委员会办公室二零一四年五月阐述微博网络的研究背景、发展现状和研究意义。介绍复杂网络的基本参数,度分布、聚类系数、平均路径长度;介绍复杂网络的三个网络模型,即小世界模型、无标度模型、适应度模型;介绍社会网络分析法的基本概念,重点介绍中心度的概念。关键词:复杂网络;微博网络;无标度;适应度;中心度 疭 、籌瓸, ,目吕宋绲奶氐恪 本文主要工作及结构安排复杂网络拓扑模型无标度网络模型社会网络的相关理论论文工作总结研究展望参考文献攻读硕士学位期间参与的科研项目致谢湖南师范大学学位论文原创性声明湖南师范大学学位论文版权
2、使用授权书 基于网络分析的微博用户特性研究第一章绪论微博网络的研究背景科研合作网络、社会关系网络等均为复杂网络。复杂网络是对现实世界的一个抽象】,它具有错综复杂的网络结构,节点复杂多样。世纪末崛起的复杂网络,渗透到诸多不同的学科如数学、工程、生物等,许多研究人员着手考虑节点个数繁多、组织繁杂的现实网络的总体特性。物理、生物、经济等诸多学科涌现了一大批学者探讨复杂网络,至此,复杂网络成为现代社会网络研究的一个十分热门的课题,被称之为“网络新科学。近几年来,随着人们生活水平的提高,因特网用户的普及化,聚友网、人人网、开心网、微博等社交网络飞速发展,用户数呈爆发式的空间人人网 起源于高校,注册用户多
3、为大学生注册用户以白领群体为主注册用户以用户为主用户数力推名人圈,舆论领袖效应明显紧紧抓住用户资源与客户端绑定草根微博,产品整和每天诙嗵跆刻亿次搜索请求微博是一种可以基于有线和无线因特网的终端平台发表简短基于网络分析的徽博用户特性研究微博网络的研究意义的政策和提案提出质疑和攻击,在这个过程中,奥巴马就是使用帮助他引导竞选。微博上的贵州流浪儿事件发起的互助行动,微博引爆的殴打空姐事件等等都表明了微博网络在应急救援、推动立法、民间互助、引导竞选、社会监督等方面都发挥了重大的作用。人们现实生活中的行为。社交网络成为信息的传播和共享的新平台,是人们展示自我、表达自我的便捷的重要途径,因此,掌握微博网络
4、的用户特性及其行为,有效的分析微博网络信息扩散机制和特点,扩散模式及反映,有利于深入了解信息扩散的内在机理,引领社会事件发展趋势,具有重要的应用价值。研究微博中复杂的用户关系可引领现实生活中社会事件的发展趋势,也能够精准有效为拥有相同兴趣爱好的人们进行个性化推荐,而且对基于网络分析的微博用户特性研究微博网络的国内外研究现状月的岣。年上半年我国互联网的普及率保持稳目前,微博数据挖掘代表性的研究主要包括话题事件分析、究了网页浏览、点击影片等。文献【】研究了天涯论坛上用户回复行为,对选好的几个帖子进行追踪,研究表明用户对发表评论的时间间隔是服从幂律分布。文献【】对用户数据分析,该研究揭示用户对电影点
5、击的时间间隙也是服从幂律分布。影响力的研究是各领域热点研究,国内外研究人员也致力于社交网络影响力的研究。文献【】运用用户之间话题的相似度来评估各用户影响力大小。文献【】是将用户的影响力划分为消极和积极两者,提出算法来评估用户的影响力大小。在社会学,政治学,广告投放中,社会网络信息传播中影响力的分析研究已经展开。以前的影响力研究主要是针对用户的邻居数目,将邻居多的用户在信息传播过程基于网络分析的微博用户特性研究博已经从影响个人生活扩展到有利于信息的传播,得到了史无前基于网络分析的微博用户特性研究据统计,微博用户中男女均衡,后是支柱,及后占,后占,后占罢。用户可以自由的根据自己的兴趣爱好随机地关注
6、他人,用户未经他人授权,不征得他人同意就可以自由关注他人,建立连接关系,并且能实时地跟踪所关注人发布的信息。因此,微博这种在线社交网络不再是以朋友交往为基础,它是一种陌生人社交平台,这个平台上陌生人可以分享和传播理念,不再是狭隘的基于朋友的社交圈,是一种稀疏的社交关系,它的开放性更广,信息传播范围也就更为广阔,基本上达到了社会信息和人际交往关系的最大化酬。本文主要工作及结构安排全文组织结构如下:率为颐前裵就记录为网络的度分布函数。累积度分布函数聚类系数删存在于生物网、因特网、经济网络等众多实际复复杂网络拓扑模型为了更好地研究复杂网络,了解网络结构和网络行动之间的关联,学者们提出了各种网络模型,
7、下面针对三种网络模型进行介绍。个人之间的平均距离约为瓷缁嵘厦扛鋈酥屑渲恍柰个人畔攘樱阂桓鲂绿砑拥慕诘悖溆胍桓鱿钟械慕诘鉰链从式可以看出无标度网络中顶点的度分布函数是遵循较旧的顶点具备较大的度。但是在诸多真实生活网络系统中,节点的度及节点的增长速率并不是仅仅与该节点加入时间有关联。比如一篇很优秀的论文发表之后,它能马上就受到学者的广泛关注,故而这篇文章就会被后来研究者多次引用。所以,节点的增长速率可能与节点的内在本质有关,例如文章的优秀度,个人的结交能力等等。和对此引入节点的适应度模型视饶凸乖焖惴缦律尽宽鸌:基于网络分析的微博用户特性研究风。蒜。通吃”局面。世纪三四十年代,社会网络理论才刚刚开始
8、。年,社会网络与复杂网络的联系和区别新浪微博网络构建谛吕宋的爬虫算法实际数据中提炼出为我们所用的数据信息过程旧。用户在使用微博的过程中,他们之间的信息传播基于机制而产生,通过以及的使得信息层层传递,形成错综复杂的交流网络。任意用户发布一条微博在网络中有可能呈现瀑布式的发散效应,这是经过用户问不停的互动才形成的。为了获取最真实的数据,让分析结果具有说服力,专门针对新浪微博编写了网络爬虫程序。新浪微博为每个注册的用户分配了一个,本文以作者本人作为起始用户,获取,然后获取朋友的,再以朋友的作为起始点,获取朋友的朋友的。爬虫算法伪代码如下:根据指定用户获得其朋友的列表 在微博网络中体现在相互关注等关系中,而弱关系体现为单向的关注关系。用户发表微博,既可以是用户自己创作的文字,也可以是转发或者是对其它用户的微博发表评论等。微博网络中有关注关系、转发关系、评论关系、引用关系、提及关系、收藏关系。有研究者指出尽管这几种关系有不同的结构形态,但它们同时又拥有某些共性特质及联系。其中关注关系是弱关系,本文就是基于弱关系的研究。基于网络分析的微博用户特性研究图没的关系示例图