李永乐 数学讲师
广受学生信赖的“线代王”
考试科目:896情报检索语言
一、复习要求:
要求考生熟悉情报检索语言的基本概念与理论,能掌握与运用情报检索语言在词汇控制、句法控制、参照显示、兼容互换、自然语言处理,以及有关计算机情报检索、标引等方面的知识。
二、主要复习内容:
1、情报语言的名称;人工语言;情报语言与逻辑学;情报语言的研究范围;情报语言的分类。
重点:分类情报语言与主题情报语言的具体类别,掌握每个类别的基本原理及应用。
2、体系与等级的从属;体系分类的基本要素;分类情报语言与科学分类;分类号的类别与制度;分类规则;体系分类语言缺陷;组配分类情报语言概述;中外分类语言简介。
重点:准确揭示体系分类语言的缺陷;掌握中外主要分类语言的基本结构。
3、标题法的由来及发展;标题法的词汇控制;标题的形式;标题法评价;元词法原理;单元词范围及选词;单元词规范;元词法评价;键词法原理;键词法表现形式;键词法范围与规范;键词法评价;叙词法与其他情报语言比较;叙词表的结构;主题情报语言的先组定组式、先组散组式、后组式;主题情报语言与分类情报语言比较。
重点:熟悉叙词法的原理与基本结构。
4、词汇控制的必要性;词汇控制的准则;词汇控制的范围;词汇控制利弊相倚;叙词语言的词汇控制;词汇控制的方式;分类情报语言的词汇控制等。
重点:了解叙词语言词形控制、词义控制、词间关系控制、先组度控制的原理;正确运用词汇控制的四种方式(标引与检索均予控制先控词表;标引控制,检索不控制;标引与检索均不控制;标引不控制,检索不作严格控制)。
5、句法控制的意义;引用次序(显著性引序;范畴职能引序;上下文从属引序;我国引序等);辅助符号(联系符号、职能符号、加权等);轮排;分类情报语言的句法控制。
重点:掌握并运用句法控制中的引序正确分析主题因素。
6、等同参照关系(同义词、学名与俗称、旧称与新称、简称与全称、不同译名间、人为等同、用项组代等);属分参照关系(属种、非属种、人为等级关系、族首词的表现形式等);相关参照关系(非等同、非等级关系、等级关系的相关、参项组代形式等);字顺主表;字顺附表;轮排索引;多语种对照索引;字顺索引与入口词表;范畴索引;词族索引;叙词关系图;字顺结构与索引的组合形式;叙词表的词汇评价等。
重点:从词量、非叙词与叙词的比率、参照度(F项词数+S项词数+C项词数/词表叙词总数)、关联比(叙词总数一无关联词总数/词表叙词总数)、先组度、范畴与词族规模等角度对叙词表进行词汇评价。
7、分类与主题的思维区别;一体化语言的具体类型;一体化语言的原理;情报系统的兼容性兼容与互换的模式与方法。
重点:了解分面叙词表、叙词表式字顺索引、分类叙词对照索引、集成叙词表等一体化语言的原理;掌握词汇转换、中介词典、宏观与微观词表、集成词表、叙词词库、算法途径、术语、分类与主题语言的兼容与互换的模式与方法。
8、自然语言与计算机检索;自然语言的应用方式(无标引方式、自动标引、人工标引);汉语自然语言的分词技术(词典分词、切分标记分词等);单汉字检索;自然语言与情报检索效率;自然语言与后控词表;自然语言检索的语言逻辑。
重点:具体论析自然语言与信息检索的语言关联。
9、文献标引与信息标引;主题与类别分析;隐含主题分析;主题转化为叙词或类号;标引深度规则;标引书写规则;主体概念优先保证规则;宽泛概念谨慎使用规则;过度标引控制规则;尊重组代用词规则;自然语言介入规则;尊重先组词规则;必要时采用上位词或近义词标引规则;词汇组配规则(字面组配谨慎使用、组配不可越级进行、防止虚假组配、避免多义组配、正确使用组配符号等);标引规则综合运用。
重点:着重掌握标引规则综合运用方面的知识。
10、情报检索系统类型(文献信息检索系统、数据库管理系统、自动问答系统、管理信息系统、决策支持系统);计算机情报检索系统的构成(逻辑构成、物理构成);检索式的编制(要求、语言词汇的选择、组配符号、反馈调整);检索技术(布尔检索、截词检索、限制检索、原文检索、加权检索与聚类检索;文档检索技术(顺排文档检索技术、倒排文档检索技术、其他倒排文档检索技术);自然语言计算机处理的水平深度;智能情报检索。
重点:正确理解并运用计算机情报检索技术。