试论中文信息处理的主流技术--计算机论文答辩

教育论文中心

广告服务

论文搜索

论文发表

会员专区

在线购卡

服务帮助

联系我们

硕士论文

博士论文

当前位置：教育论文中心首页--计算机论文答辩--试论中文信息处理的主流技术

站内搜索

科目列表

市场营销	管理理论	人力资源
电子商务	社会实践	先进教育
伦理道德	艺术理论	环境保护
农村研究	交通相关	烟草论文
电子电气	财务分析	融资决策
电影艺术	国学论文	材料工程
语文论文	数学论文	英语论文
政治论文	物理论文	化学论文
生物论文	美术论文	历史论文
地理论文	信息技术	班主任
音乐论文	体育论文	劳技论文
自然论文	德育管理	农村教育
素质教育	三个代表	旅游管理
国际贸易	哲学论文	工商管理
证券金融	社会学	审计论文
会计论文	建筑论文	电力论文
水利论文	园林景观	农林学
中医学	西医学	心理学
公安论文	法学法律	思想汇报
法律文书	总结报告	演讲稿
物业管理	经济学	论文指导
计算机	护理论文	社会调查
军事论文	化工论文	财政税收
保险论文	物流论文	语言教育
教育教学	给水排水	暖通论文
结构论文	综合类别	硕士论文
博士论文

试论中文信息处理的主流技术

【计算机论文答辩】论文关键词：信息处理　N元模型　语音识别　句法分析论文摘要：本文分析了中文信息处理的主流技术，尤其是几个重要的部分，即N元模型、语音识别和句法分析技术。
一、中文信息处理的特点
（一）汉字的特殊性
我们都知道，英语在计算机信息处理方面的优势就是其字母数量有限，因而可以很容易的进行输入输出以及信息的加工和处理，而中文的汉字则数量庞大，且字形相对复杂，这就给汉字的编码带来了不小的困扰。因此我们根据汉字信息处理过程中的不同要求对汉字进行了不同形式的编码，总结来说有以下几种方案，即汉字输入编码,汉字标准编码,汉字内码和汉字形码。
（二）书面汉语的特殊性
汉语的另一个特征是在书面表达中，词语和记号之间没有明显的分隔标记，这就使自动分词在书面汉语分析中成立一个难题。分词需要将连续的字按照一定的规范进行有序的组合，比较英文我们会发现，英文单词之间都是用空格来做分隔符，而中文则是习惯通过字、整句以及段落进行简单的划分，而这其中的一个难点就是对词语的划分，我们都知道，英语中也有短语划分的问题，但是由于中文的词语远比英语的数量和范围要庞大，因而处理起来更为困难。
（三）汉语语音的特殊性
在语音方面，汉语的特征是音节结构相对简单，音节划分界限比较清晰，但是声调和变调是中文与英文的显著区别，因而在语音识别和语音合成方面来讲这是一个劣势，但是总体上来说汉语语音的处理比之其他方面来说还是相对容易的。
（四）汉语语法的特殊性
在语法方面，汉语词汇的句法功能相对来说难以判断，这与英语语言上的多变形态有着截然不同的表现。汉语主要依靠词序和虚词来表达不同的含义，因此如果不能很好的掌握句法，就特别容易产生歧义，因此汉语语句自动分析这一重要技术是一项难以攻克的技术。
二、中文信息处理的若干技术
（一）N元模型
设wi是文本中的任意一个词,如果已知它在该文本中的前两个词wi-2w-1,便可以用条件概率P(wi|wi-2w-1)来预测wi出现的概率。这就是统计语言模型的概

<<<<<全文未完>>>>> 全文字数约2083字

是否要阅读全文?点卡会员将扣除1点!点击阅读全文

要阅读全文请先注册成VIP会员！详情请阅读会员专区！
VIP会员可以阅读全文，欢迎加入VIP会员专区！加入VIP会员步骤如下：注册用户名→在线购卡

您可能感兴趣的论文

论文标题	页/字数	分类
试论中文信息处理与现代汉语语法	3700字	期刊论文
中文信息处理中若干技术的研究与实	90页	硕士论文
基于语境和停用词驱动的中文自动分	50页	硕士论文
基于优化最大匹配的中文分词方法研	68页	硕士论文
基础教育资源搜索引擎中的中文分词	54页	硕士论文
中文姓名自动识别系统的设计与实现	70页	硕士论文
中文文本自动分类的研究	80页	硕士论文
中文词法分析的研究及其应用	142页	博士论文
中文文本分词研究	39页	硕士论文
N-gram技术在中文词法分析中	65页	硕士论文
基于规则的命名实体识别研究	52页	硕士论文
教育领域主观题智能阅卷关键技术的	65页	硕士论文
基于避免交集型歧义的最大匹配算法	66页	硕士论文
面向中文信息处理的组合式述补结构	58页	硕士论文
面向中文信息处理的现代汉语动宾语	160页	博士论文