前言
计算语言学(computational linguistics)是用计算机研究和处理自然语言的一门新兴的交叉学科,又叫作自然语言处理(natural languageprocessing)。
由于自然语言处理的研究对象是自然语言,因此,语言学家把它归为语言学的一个分支;由于自然语言处理采用先进的计算机科学技术来研究和处理自然语言,因此,计算机科学家把它归为计算机科学的一个分支;由于自然语言处理要研究自然语言的形式结构和自然语言处理的算法,因此,数学家把它归为应用数学的一个分支。这种情况说明,计算语言学不是一门单纯的学科,而是交叉学科,具有明显的跨学科特点。计算语言学的教学和研究有助于推进当前新文科的建设。
本书属于外国语言文学核心概念与关键术语系列中的一本,通过100条核心概念和关键术语来展示计算语言学的脉络和基本术语体系,便于读者携带和查询,独具特色。
本书收集的100条计算语言学核心概念和关键术语,涉及计算语言学通论、语音自动处理、词汇自动处理、句法自动处理、语义自动处理、统计自然语言处理、基于神经网络和深度学习的自然语言处理等内容,适合语言学专业和计算机专业的师生,他们可以使用本书来更新知识,把语言学知识与计算机知识紧密地结合起来。
本书共收入计算语言学中最能代表学科本质的核心概念30条、最不可或缺的关键术语70条,共计100条。根据系列图书的要求,本书全部术语条目均按中文术语的音序排列,并有英汉术语对照和汉英术语对照。
冯志伟
中国中文信息学会会士
中国人工智能学会理事
奥地利维斯特奖获得者
香港圣弗兰西斯科技人文奖获得者
中国计算机学会NLPCC杰出贡献奖获得者
2024年10月