前言
随着互联网、计算机等信息技术和应用的发展,人们的学习、生活和工作的诸多行为都从线下转移到线上进行,人们的在线活动行为和轨迹被记录下来。同时,Web 2.0技术以及社会媒体的兴起和广泛使用,使得人们的社会交互和意见情感在网上表露无遗,这些都使得利用计算机技术分析人类的社会活动,发现其中蕴含的规律和模式成为可能,也使社会计算这门学科成为近年来的研究和应用热点,国内外知名高校和研究机构也纷纷设立社会计算专业学科。另外,消费者的众多网上在线活动中隐含着有意义的行为规律和兴趣偏好,挖掘这些规律和偏好,可以为电子商务实现个性化服务、精准营销和开发新型业务模式提供技术和理论支持。同时,大数据、稀疏数据、富媒体、非结构化等极端数据为传统的分析技术和方法带来了巨大的挑战。
本书主要介绍著者近几年在商务智能和社会计算领域的最新研究成果,重点探讨如何根据用户的在线行为特点,针对电子商务过程中出现的管理需求,提炼和定义新型用户行为模式,刻画用户的兴趣偏好; 在极端数据情况下如何高效发现各类知识,构建用户兴趣偏好模型; 最后通过严谨的理论分析和广泛的实验,对所提方法和发现的结果进行验证和评价,旨在为推动数据挖掘和社会计算的理论发展做出贡献,也为业界的实际应用提供参考。本书的内容根据用户在线行为的类别进行组织,分别介绍新型的分析和挖掘方法。在线行为包括搜索、网购、标注、浏览、评论以及社交等,分析方法涉及各种概率统计、数据挖掘、社会网络分析等。研究内容包括搜索意图的发现、热点话题的侦测、在线购物模式的挖掘、周期模式的定义和分析、标签相似度的衡量、高效的聚类,以及针对中文表达的意见挖掘、个性化推荐和社会网络中的相似度、影响度的有效度量和计算等。本书主要面向高校和科研单位的硕士生、博士生和相关研究领域的学者,对企业营销、运营及信息技术等方面的管理人员也有一定的参考价值。
本书由国家自然科学基金项目“基于数据挖掘的用户网上行为模式的发现技术与应用研究”(项目编号70871068)和“通过社会化媒体挖掘用户兴趣的方法及应用研究”(项目编号71272029)的研究成果凝练而成。在项目的研究过程中,著者及其相关团队紧密配合,深入研究,在许多国内外热点和前沿研究问题上,勇于面对挑战,攻克了许多难点,取得了一系列创新型研究成果。为此,衷心感谢研究团队和合作者在研究项目中所做出的学术贡献。
作为新兴领域的一部专著,难免有疏漏之处,敬请读者指正。
著者
2014年4月于清华园