编辑推荐
(1)国家出版基金项目
(2)“十三五”国家重点图书出版规划项目
(3)100多万字的集大成之作
内容简介
自然语言计算机形式分析是横跨语言学、计算机科学和数学的一个交叉研究领域,是自然语言计算机处理的关键。自然语言是信息主要的负荷者,在当今信息网络时代,计算机已经日益普及,普通计算机用户可以使用的语言资源正以惊人的速度飞快增长。互联网主要是由自然语言构成的,它已经成为了极为丰富的语言信息资源;移动通信也是以自然语言为媒介的,它已经渗透到日常生活的各个领域。因此,自然语言计算机形式分析对于国家的信息化建设,对于互联网和移动通信的安全具有重要作用。
本书对自然语言处理中的各种理论和方法进行了系统的总结和梳理。首先讨论了自然语言处理的学科定位;接着介绍了语言计算的一些先驱研究;然后以主要的篇幅讨论自然语言处理中的各种形式模型,包括基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于格语法的形式模型、基于词汇主义的形式模型、语义自动处理的形式模型、系统功能语法、语用自动处理的形式模型、概率语法、Bayes公式与动态规划算法、N元语法和数据平滑、隐Markov模型(HMM)、语音自动处理的形式模型、统计机器翻译的形式模型;同时还讨论了自然语言处理系统的评测问题;最后从哲学的角度讨论了自然语言处理中的理性主义和经验主义,探索理性主义方法和经验主义方法相结合的途径。
本书说理透彻、语言流畅、实例丰富、深入浅出,适合从事自然语言处理研究的科研人员、大学师生阅读,也可以作为人工智能、计算语言学等课程的教学参考书。
作者简介
冯志伟,1939年出生,计算语言学家,先后在北京大学和中国科学技术大学研究生院获文科和理科硕士学位。精通英语、德语、法语、俄语、日语等多门外语,具有宽厚、坚实的语言学、数学和计算机科学功底,是一位难得的横跨文理科的复合型专家。50多年来一直从事语言学、数学和计算机科学的跨学科研究,是我国从事自然语言处理和计算语言学研究的学者之一。
内页插图
目录
序
第1章自然语言处理的学科定位
1.1从自然语言处理的过程来考察其学科定位
1.2从自然语言处理的范围来考察其学科定位
1.3从自然语言处理的历史来考察其学科定位
1.4当前自然语言处理发展的几个特点
参考文献
第2章语言计算研究的先驱
2.1Markov链
2.2Zipf定律
2.3Shannon关于“熵”的研究
2.4Bar-Hillel的范畴语法
2.5Harris的语言串分析法
2.6О.С.Кулагина的语言集合论模型
参考文献
第3章基于短语结构语法的形式模型
3.1语法的Chomsky层级
3.2有限状态语法和它的局限性
3.3短语结构语法
3.4递归转移网络和扩充转移网络
3.5自底向上分析和自顶向下分析
3.6通用句法处理器和线图分析法
3.7Earley算法
3.8左角分析法
3.9CYK算法
3.10Tomita算法
3.11管辖约束理论与最简方案
3.12Joshi的树邻接语法
3.13汉字结构的形式描述
3.14Hausser的左结合语法
参考文献
第4章基于合一运算的形式模型
4.1中文信息MMT模型
4.2Kaplan的词汇功能语法
4.3Martin Kay的功能合一语法
4.4Gazdar的广义短语结构语法
4.5Shieber的PATR
4.6Pollard的中心语驱动的短语结构语法
4.7Pereira和Warren的定子句语法
参考文献
第5章基于依存和配价的形式模型
5.1配价观念的起源
5.2Tesnière的依存语法
5.3依存语法在自然语言处理中的应用
5.4配价语法
5.5配价语法在自然语言处理中的应用
参考文献
第6章基于格语法的形式模型
6.1Fillmore的格语法
6.2Fillmore的框架网络
参考文献
第7章基于词汇主义的形式模型
7.1Gross的词汇语法
7.2链语法
7.3词汇语义学
7.4知识本体
7.5词网
7.6知网
7.7Pustejovesky的生成词库理论
参考文献
第8章语义自动处理的形式模型
8.1义素分析法
8.2语义场
8.3语义网络
8.4Montague语法
8.5Wilks的优选语义学
8.6Schank的概念依存理论
8.7Mel’chuk的意义文本理论
8.8词义排歧方法
参考文献
第9章系统功能语法
9.1系统功能语法的基本概念
9.2系统功能语法在自然语言处理中的应用
参考文献
第10章语用自动处理的形式模型
10.1Mann和Thompson的修辞结构理论
10.2文本连贯中的常识推理技术
10.3言语行为理论和会话智能代理
参考文献
第11章 概率语法
11.1概率上下文无关语法与句子的歧义
11.2概率上下文无关语法的基本原理
11.3概率上下文无关语法的三个假设
11.4概率词汇化上下文无关语法
参考文献
第12章Bayes公式与动态规划算法
12.1拼写错误的检查与更正
12.2Bayes公式与噪声信道模型
12.3最小编辑距离算法
12.4发音问题研究中的Bayes方法
12.5发音变异的决策树模型
12.6加权自动机
12.7向前算法
12.8Viterbi算法
附录
参考文献
第13章N元语法和数据平滑
13.1N元语法
13.2数据平滑
参考文献
第14章隐Markov模型(HMM)
14.1HMM概述
14.2HMM在语音识别中的应用
参考文献
第15章语音自动处理的形式模型
15.1语音和音位的形式描述方法
15.2声学语音学和信号
15.3语音自动合成的方法
15.4语音自动识别的方法
参考文献
第16章统计机器翻译中的形式模型
16.1机器翻译与噪声信道模型
16.2最大熵模型
16.3基于平行概率语法的形式模型
16.4基于短语的统计机器翻译
16.5基于句法的统计机器翻译
参考文献
第17章自然语言处理系统的评测
17.1评测的一般原则和方法
17.2语音合成和文语转换系统的评测
17.3机器翻译系统的评测
17.4语料库系统的评测
17.5国外自然语言处理系统的评测
参考文献
第18章自然语言处理中的理性主义与经验主义
18.1哲学中的理性主义和经验主义
18.2自然语言处理中理性主义和经验主义的消长
18.3理性主义方法和经验主义方法的利弊得失
18.4探索理性主义方法和经验主义方法结合的途径
参考文献
附录走在文理结合的道路上——记自然语言处理专家冯志伟先生
自然语言计算机形式分析的理论与方法 下载 mobi epub pdf txt 电子书 格式