总结 习题[作者空间]
概述 1. 基本观点 句子由两个相对独立的层次来描述:(1)成分结构层次描述句子成分的结构关系(2)功能结构层次描...[作者空间]
提出起因 Chomsky 短语结构语法生成能力太强,产生许多不符合语法或有歧义的句子; 标记十分简单,分析能力有限...[作者空间]
语法理论的几个里程碑(Landmarks) ❖ 1950s Chomsky 提出了4 类形式语法❖ 1980s C...[作者空间]
总结 下一步分词与词性标注研究 习题[作者空间]
· 基于规则的词性标注方法· 基于统计模型的词性标注方法· 规则和统计方法相结合的词性标注方法· 基于有限状态变换...[作者空间]
面临的问题 词性(part-of-speech, POS)标注(tagging)的主要任务是消除词性兼类歧义。在任...[作者空间]
命名实体(Named Entity, NE) (专有名词) 人名(中国人名和外国译名)、地名、组织机构名、数字、日...[作者空间]
? 有词典切分/ 无词典切分? 基于规则的方法/ 基于统计的方法 1. 最大匹配法(Maximum Matchin...[作者空间]
两种测试 封闭测试 / 开放测试 专项测试 / 总体测试 评价指标 正确率(Correct ratio/Preci...[作者空间]
汉语自动分词的重要性 自动分词是汉语句子分析的基础 词语的分析具有广泛的应用(词频统计,词典编纂,文章风格研究等)...[作者空间]
基本任务 单词识别 形态还原 英语单词的识别 英语中常见的特殊形式的单词识别 英语单词的形态还原 1. 有规律变化...[作者空间]
词是自然语言中能够独立运用的最小单位,是自然语言处理的基本单位。 自动词法分析就是利用计算机对自然语言的形态...[作者空间]
总结 习题[作者空间]
解决问题3:模型参数学习 给定一个观察序列 ,如何根据最大似然估计来求模型的参数值?或者说如何调节模型的参数,使得...[作者空间]
解决问题2:如何发现“最优”状态序列、能够“最好地解释”观察序列 解释不是唯一的,关键在于如何理解“最优”的状态序...[作者空间]
1. 基本思想 定义后向变量是在给定了模型和假定在时间状态为的条件下,模型输出观察序列的概率: ……(公式6....[作者空间]
解决问题1:快速计算观察序列概率 给定模型和观察序列 ,快速计算: 1. 基本方法 对于给定的状态序列 ,? 困难...[作者空间]