logo
教育论文中心  教育论文中心   广告服务  广告服务   论文搜索  论文搜索   论文发表  论文发表   会员专区  会员专区   在线购卡   在线购卡   服务帮助  服务帮助   联系我们  联系我们   网站地图  网站地图   硕士论文  会员专区   博士论文
当前位置:教育论文中心首页--计算机论文 答辩--试论中文信息处理的主流技术
推荐论文
面向中文信息处理复句特征分析器
中文信息处理关键问题研究
中文信息处理中命名实体识别问题
我国主流媒体对当代社会主流
面向信息处理现代汉语“名+名”
信息处理用同音同形词研究
基于中文分词技术网络答疑系统个
一个中文语义语料库研究与建设
基于Linux和XIM协议中文
数字图书馆个性化中文文本信息服务
基于AMR中文句子语义标注及统
面向中文网络百科本体学习与知识
基于蚁群算法中文文本聚类研究
中文文本分词及词性标注自动校对方
中文文本复制检测技术研究
中文文字差错率统计软件实现
 
站内搜索
 
 
科目列表
市场营销 管理理论 人力资源
电子商务 社会实践 先进教育
伦理道德 艺术理论 环境保护
农村研究 交通相关 烟草论文
电子电气 财务分析 融资决策
电影艺术 国学论文 材料工程
语文论文 数学论文 英语论文
政治论文 物理论文 化学论文
生物论文 美术论文 历史论文
地理论文 信息技术 班主任
音乐论文 体育论文 劳技论文
自然论文 德育管理 农村教育
素质教育 三个代表 旅游管理
国际贸易 哲学论文 工商管理
证券金融 社会学 审计论文
会计论文 建筑论文 电力论文
水利论文 园林景观 农林学
中医学 西医学 心理学
公安论文 法学法律 思想汇报
法律文书 总结报告 演讲稿
物业管理 经济学 论文指导
计算机 护理论文 社会调查
军事论文 化工论文 财政税收
保险论文 物流论文 语言教育
教育教学 给水排水 暖通论文
结构论文 综合类别 硕士论文
博士论文    
 
 
 
试论中文信息处理的主流技术

【计算机论文 答辩】论文关键词:信息处理 N元模型 语音识别 句法分析论文摘要:本文分析了中文信息处理的主流技术,尤其是几个重要的部分,即N元模型、语音识别和句法分析技术。
一、中文信息处理的特点
(一)汉字的特殊性
我们都知道,英语在计算机信息处理方面的优势就是其字母数量有限,因而可以很容易的进行输入输出以及信息的加工和处理,而中文的汉字则数量庞大,且字形相对复杂,这就给汉字的编码带来了不小的困扰。因此我们根据汉字信息处理过程中的不同要求对汉字进行了不同形式的编码,总结来说有以下几种方案,即汉字输入编码,汉字标准编码,汉字内码和汉字形码。
(二)书面汉语的特殊性
汉语的另一个特征是在书面表达中,词语和记号之间没有明显的分隔标记,这就使自动分词在书面汉语分析中成立一个难题。分词需要将连续的字按照一定的规范进行有序的组合,比较英文我们会发现,英文单词之间都是用空格来做分隔符,而中文则是习惯通过字、整句以及段落进行简单的划分,而这其中的一个难点就是对词语的划分,我们都知道,英语中也有短语划分的问题,但是由于中文的词语远比英语的数量和范围要庞大,因而处理起来更为困难。
(三)汉语语音的特殊性
在语音方面,汉语的特征是音节结构相对简单,音节划分界限比较清晰,但是声调和变调是中文与英文的显著区别,因而在语音识别和语音合成方面来讲这是一个劣势,但是总体上来说汉语语音的处理比之其他方面来说还是相对容易的。
(四)汉语语法的特殊性
在语法方面,汉语词汇的句法功能相对来说难以判断,这与英语语言上的多变形态有着截然不同的表现。汉语主要依靠词序和虚词来表达不同的含义,因此如果不能很好的掌握句法,就特别容易产生歧义,因此汉语语句自动分析这一重要技术是一项难以攻克的技术。
二、中文信息处理的若干技术
(一)N元模型
设wi是文本中的任意一个词,如果已知它在该文本中的前两个词wi-2w-1,便可以用条件概率P(wi|wi-2w-1)来预测wi出现的概率。这就是统计语言模型的概
 
 
<<<<<全文未完>>>>> 全文字数约2083字
是否要阅读全文?点卡会员将扣除1点!点击阅读全文
要阅读全文请先注册成VIP会员!详情请阅读会员专区
VIP会员可以阅读全文, 欢迎加入VIP会员专区! 加入VIP会员步骤如下: 注册用户名在线购卡
 
 您可能感兴趣的论文
论文标题页/字数分类
中文信息处理与现代汉语语法3700字期刊论文
中文信息处理中若干技术研究与实90页硕士论文
基于语境和停用词驱动中文自动分50页硕士论文
基于优化最大匹配中文分词方法研68页硕士论文
基础教育资源搜索引擎中中文分词54页硕士论文
中文姓名自动识别系统设计与实现70页硕士论文
中文文本自动分类研究80页硕士论文
中文词法分析研究及其应用142页博士论文
中文文本分词研究39页硕士论文
N-gram技术中文词法分析中65页硕士论文
基于规则命名实体识别研究52页硕士论文
教育领域主观题智能阅卷关键技术65页硕士论文
基于避免交集型歧义最大匹配算法66页硕士论文
面向中文信息处理组合式述补结构58页硕士论文
面向中文信息处理现代汉语动宾语160页博士论文
 
 
| 会员专区 | 在线购卡 | 广告服务 | 网站地图 |
版权所有 教育论文中心 Copyright(C) All Rights Reserved
联系方式: QQ:277865656 或写信给我