





定价:58元
印次:1-2
ISBN:9787302420729
出版日期:2015.12.01
印刷日期:2017.01.12
图书责编:薛慧
图书分类:学术专著
随着以社交网络为代表的图数据规模高速增长,复杂的查询需求不断涌现,处理这类大规模数据有许多理论问题需要解决。本书结合作者多年的研究积累,系统地介绍了大图分布式处理中基础的数据划分、组织和消息管理技术,以及三角形、最大k边连通子图、最小生成树、频繁子图、重叠社区发现等大图查询和分析算法的优化,并对系统实现技术进行了探讨。 本书适合高等院校计算机专业的教师、学生及计算机应用系统的研发人员阅读参考。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
谷峪,东北大学信息学院副教授,博士生导师,CCF高级会员,ACM会员。2010年于东北大学获计算机软件博士学位。作为项目负责人承担(完成)国家自然科学基金面上项目1项,国家自然科学基金青年基金项目1项,国家973计划子课题1项和中央高校基本科研业务费专项资金2项,东北大学引进人才启动基金1项。作为主要技术骨干先后参加过3项国家自然科学基金重点项目。近年来,以主要作者在VLDB、ICDE、CIKM、EDBT、DASFAA等知名国际会议以及IEEE Transactions on Knowledge and Data Engineering、Information Systems、Knowledge and Information Systems、计算机学报、软件学报等著名国际杂志和国内一级学报上发表论文50余篇,SCI收录10余次,EI收录近40次。曾获DASFAA2009 的best student paper award、ADC2012的best paper award、NDBC2014的best paper award等多项优秀论文奖, 获辽宁省自然科学学术成果奖1等奖等奖励。担任WAIM 2012 wokshop GDMM2012的程序委员会主席,APWeb2015,ADC2015等国际会议的PC member, TKDE、WWWJ、 FCS、计算机学报、软件学报等著名杂志的审稿人。
数据能够有效地反映数据之间普遍存在的联系,具有丰富的表达力,在Web、社会网络、生物和化学数据库等领域获得了广泛的应用。随着数据获取方式的多样化,图数据规模越来越大,应用也日趋复杂,传统的集中式图查询处理和分析挖掘方法满足不了日益增长的功能和性能上的需求。特别是近年来随着云计算和大数据等概念的兴起,分布式图处理计算也随之得到快速的发展,成为热点的研究领域。本专著系统综述了目前该领域的主要研究进展,并总结和整理了作者近年来在这方面的研究成果,内容囊括大规模图数据分布式处理的主要模型、技术和系统,包括执行机制、数据组织、代表性算法,以及系统实现和典型应用等各个方面。本书试图为读者系统地展现大数据技术高速发展和变革时代大图处理区别于传统数据管理和分布式计算的新技术、新思想、新系统和新挑战。 本书共分为10章,第1章主要介绍大规模图数据分布式处理的研究背景和问题;第2章介绍分布式图计算模型和执行机制;第3章和第4章分别介绍基础的数据组织问题,包括数据的划分以及存储和索引;第5章到第9章介绍代表性的大图复杂查询、分析和挖掘算法及其分布式实现技术,包括三角形查询、最大k边连通子图查询、最小生成树搜索、频繁子图挖掘和重叠社区发现;第10章对现有的主要分布式大图处理系统和典型应用进行综述。 本书涉及的研究课题得到国家重点基础研究发展计划(“973计划”)项目(No. 2012CB316201)、国家自然科学基金项目(61472071、61272179、61433008)、教育部中国移动科研基金项目(MCM20125021)等资助。 作者指导的部分研究生参与了本书的撰写和相关课题的研发,...
1.1大图数据处理的背景
1.2图数据的表示
1.3传统的大图数据管理方法
1.4云计算环境处理大图数据的优势
1.5新型大图计算系统面临的挑战
1.6关键技术问题
第2章大图分布式处理的计算模型和执行机制
2.1大图分布式处理的基本计算框架
2.1.1基于MapReduce的计算框架
2.1.2基于BSP的计算框架与GAS模型
2.1.3MapReduce与BSP对比
2.1.4其他处理框架
2.2图查询处理的遍历模式
2.2.1以顶点为中心
2.2.2以子图为中心
2.2.3以边和路径为中心
2.3消息通信
2.3.1消息发送时序控制
2.3.2消息交换模式
2.3.3网络通信平台
2.3.4上层消息优化技术
2.4同步控制
2.4.1同步模式
2.4.2异步模式
2.4.3混合模式
2.4.4跨步模式
2.5容错管理
2.5.1故障恢复技术
2.5.2故障侦测技术
2.6任务调度
2.7可扩展性
第3章大图数据划分技术
3.1图数据划分技术综述
3.1.1离线划分算法
3.1.2在线划分算法
3.1.3动态划分算法
3.2大图划分定义
3.2.1处理流程和定义
3.2.2真实图的局部性分析
3.3OnFlyP划分算法
3.3.1Range划分
3.3.2OnFlyP划分
3.3.3负载均衡控制机制
3.3.4计算接口描述
3.3.5动态调整机制
3.4性能评价
3.5小结
第4章大图数据分布式存储与索引技术
4.1大图数据的存储索引技术...