|
|
|
受控语言与自然语言结合模式比较研究
|
|
【民族传统体育论文】随着信息传递的网络化,用户对检索语言也提出了差异性要求,需要检索语言和检索系统的交互更加方便、直接、透明。传统的中介行为已被抛弃,自主型“浏览检索”方式成为潮流。用户需求是服务性行业发展的动力,所以研发适应用户需求的新型检索模式也是大势所趋。规范化的受控语言与自然语言都有各自不可替代的优势,它们的优缺点处于相对、互补的状态。单独使用一种方式会因其缺点而达不到较优的检索效率。网络环境下,二者的结合是提高检索效率的必然要求。 1、受控语言与自然语言结合模式比较分析 理想的检索状态是:在系统外部,用户可以灵活使用自己的语言(自然语言)检索和组织信息,不需要看见和直接使用受控语言;在系统内部,存在着以超级知识库为基础的、高度专业化的受控语言,支持用户自然语言提问的转换。受控语言与自然语言一体化模式有很多种,其中影响较大的有:词素相似度识别转换模式、一体化语言系统模式、概念空间模型、学科事物概念组配模式和后控制模式等。现将此五种结合模式在体系结构上的相似与差异性作一比较。 1.1 五种结合模式的相似性 它们的共同点是:基本都允许用户使用自然语言检索提问,由系统进行一定程度上的词汇转换与控制,支持用户易用性要求。在体系结构上都能够:①构建语义网络。即以概念为中心对词汇实施控制,通过识别概念之间的关系,建立一个与概念体系相对应的具有层次结构的术语体系。②使用概念代码。以概念为中心,以唯一标识代码为主体是新型情报检索语言系统的特点。③使用入口词表。将符合语义索引要求的主题词或同义词、相关词反馈给用户,由用户来选择、确定他所需要的概念词,最后提交给索引系统进行检索。 1.2 五种结合模式的差异性 1.2.1 词素相似度识别转换模式 其代表是EMT系统,它的每个主题词款目基本数据项有:款目主题词、汉语拼音、英文译名、范畴代号、注释、范畴名称、用项、代项、属项、分项、参项等[1]。另外在其基本数据项中又增加了释义和词素项。各主题词相互之间构成用代、属分、参照3类关系。各主题词款目之间的不同形式排列形
|
|
|
|
<<<<<全文未完>>>>> 全文字数约4766字
|
要阅读全文请先注册成VIP会员!详情请阅读会员专区!
VIP会员可以阅读全文, 欢迎加入VIP会员专区! 加入VIP会员步骤如下:
注册用户名→在线购卡
|
|
|
|