搜档网
当前位置:搜档网 › 信息检索技术

信息检索技术

信息检索技术
信息检索技术

第一章信息检索概述

1,什么是信息检索?它有哪些主要类型?

信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。

旧分类方法:文献检索、事实检索、数据检索

新分类方法:文本检索、数值检索、音/视频检索

2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点?

答:即信息集合与需求集合的匹配与选择。

(1)信息集合是指有关某一领域的,经采集、加工的信息的集合。形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。(2)需求集合:用户的信息需求是在社会实践活动中产生的。众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起联系与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的

动因。

3,信息检索主要经历了哪些不同的发展阶段?各阶段

有何特点?

(1)手工检索阶段,主要特点可以概括为印刷文献(图

书、期刊、会议、专利、学位论文)为主要检索对象;

以各类文摘、题录、和目录性工具书为可利用的主要

检索工具;以图书馆的参考咨询部门为开展信息检索

服务的中心机构。(2)计算机化检索阶段(脱机批处

理检索时期、联机实时检索时期、联机网络化与多元

化检索时间),主要特点:以各类机读数据库为检索对

象;各类信息中心,联机服务中心作为新兴的信息服

务部门而存在;信息检索用户逐渐由专业检索人员(检

索中介)向个人终端用户转移和扩散。(3)网络化检

索时期,分布式存储、分布式检索、分布式处理,检

索范围领域广,传统技术与网络技术的结合,用户界

面友好度,检索效率低。

4、名词解释

1)文本检索:指以各种自然语言符号系统所表示的信

息作为主要检索对象的信息检索活动。

2)数值检索:针对数值型数据的查询而发展起来的

一类有特色的信息检索。

3)音视频检索:针对各种数字化音频与视频信息而进

行查询的一类新兴的信息检索操作。

4)信息存储与检索:将信息按照一定的方式组织和存

储起来,并能够根据信息用户的需求找出其中相关信

息的过程。信息检索是一种有目的和组织化的信息存

取活动,其中包括“存”和“取”两活动。

5)文献检索:以文献(包括文献、题目、或全文)为

检索对象的一类信息查询活动,是一种相关性检索。

6)数据检索:以经过选择、整理、鉴定的各种数据信

息的性能参数作为检索对象的一类检索,是一种确定

性检索。

7)事实检索:针对从文献中提取出来的各种事实(或

知识项)所进行的检索活动,是一种确定性检索。

第二章信息源

1,如何鉴别高质量的期刊?

目前国内外公认的鉴别方式有2种:核心期刊和同行

评审期刊。

(1)核心期刊:指的是刊载某一学科或专业有关的信

息较多,且学术水平较高,能够反映该学科最新成果

和前沿动态,受到该专业读者特别关注并成为检索与

阅读首选的那些期刊。

(2)同行评审期刊:它是国内外高水平期刊对来搞评

审普遍采用的方式。具体做法是:作者将文稿寄交编

辑部并经初审合格后,为了审查论文的学术质量需要

将论文稿送交有关专家(即同行)进行评审。

2,我国出版的专利文献有哪些?

目前我国出版的专利文献主要包括专利说明书、专利

公报、专利索引等。既有一次文献,也有二次文献,

他们是:

(1)<<发明专利公报>>、<<实用新型专利公报>>和<<

外观设计专利公报>>(每周一次);

(2)<<发明专利申请公开说明书>>,<<发明专利申请

审定说明书>>及<<实用新型专利申请说明书>>。

(3)专利年度索引;

3,书目数据库的特点是:信息密度高,文献报道范围

广,数据量大,连续性和积累性强;数据结构简单,

记录格式较为固定,费用低廉;检索途经多,速度快;

更新周期较长。

4,全文数据库的特点:可直接利用;简化数据库标引

和建库工作;避免了文献二次加工中的人为差错;后

处理能力强。

5,名词解释:

1)电子信息源:指以数字化形式(即二进制码)将文

字、图像、声音、动画等存储在光、磁等存储介质上,

并能通过计算机、通信设备再现出来的信息资源。用于信息检索的机读数据库和网络信息源是目前2类最重要的电子信息源。

2)书目数据库:是一种专门存储二次文献信息的数据集合,亦称二次文献数据库,通常收录有关主题领域的各中书目信息,包括文摘、题录、目录等,以向用户提供文献信息,指引用户查找、使用原文献,包括文摘索引数据库和图书馆目录数据库。

3)文摘索引数据库主要是简要地通报有关领域某一时期发表的文献,供人们查阅与检索。

4)全文数据库:是一种源数据库,主要存储文献全文或其中的主要部分。它可以包括题名、著者、摘要、关键词、正文、参考文献和著作日期在内的数据全部收入数据库,供用户查询利用。

5)网络信息资源:是指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息源。

6)机读数据库:为了制作检索工具而输入计算机中的文献,进行组织和排序。这些有序化的数据经过日积月累就形成了机读数据库。

7)图书馆书目数据库:又称“机读目录”。机读目录主要报道和存储特定图书馆实际收藏的各种文献资料的书目信息和存储地址。既是图书馆业务部门的业务管理工具也是一般用户查找图书馆馆藏资料的工具。8)OPAC检索系统:全称为online public access catalogue system 即公共联机书目查询系统,是利用计算机终端来查询基于图书馆局域内的馆藏数据资源的一种检索方式,即通过联机查询为用户提供馆藏文献的线索。

第三章信息检索系统

1,一个通用信息检索系统的基本结构如何?它主要有那些主要模块构成?(2大功能6个模块)P41 2大功能:信息存储、信息查询

6个模块:信息采集、信息标引、创建与更新数据库、

用户界面、提问处理与检索匹配、知识组织工具。

以中间的虚点竖线为界,信息检索处理过程被分解为

信息存储和信息查询两个部分,其中,信息存储部分

包括信息采集,信息标引处理,创建与跟新数据库及

索引文档等多个处理模块,这样最终就以数据库的形

式完成了信息的收集、加工(标引)和存储任务;信

息查询部分则通过用户界面,提问处理,检索匹配等

一系列功能模块的配合,以人机对话方式完成用户对

系统的访问和信息查询的功能;而中间的知识组织工

具模块,则同时与信息存储和信息查询的多个模块相

关联,以便它们之间建立一种沟通和协调,进而使全

部功能模块相互联系形成一个有机的整体。

2,什么是标引深度和标引的专指度?

标引深度:又称标引的网罗度,是衡量标引详尽性的

指标,其含义是标引词对数据库每条记录各方面内容

表达和识别的详尽程度。

标引的专指度:是用于衡量标引词对信息记录特定内

容描述的精细程度。

3,什么是自动标引?自动标引:通过利用计算机对

标引特征的出现频率、出现位置、提问频率等进行统

计,进而采用一定的加权策略来实现,主要分为自动

抽词标识和自动赋词标识。自动抽词标引:是指利用

计算机直接从文献的题名、文摘或正文中抽取关键词

来标识文献内容,并自动生成关键词索引文档(或倒

排文档)。自动赋词标引:让计算机模仿标引员的赋词

标引方法,通过分析文献内容,从词表中选取与文献

主题相符或密切相关的词语符号做索引词。

4,何谓文档?主文档与倒排文档。文档是按一定结构

组织的若干逻辑记录构成的信息集合。是数据库数据

组织的基本形式,作为一个处理单位存储在介质上;

分为主文档(顺序文档)和倒排文档,随机文档。

顺序文档:是文档在计算机存储器中的一种存放形式,

文档中的全部记录按顺序一个接一个地存放,记录的

物理位置通常按照存取号由小到大排列,记录之间的

逻辑顺序与物理顺序一致。

倒排文档:是把数据库检索中的一切可检索字段或属

性值(主题词、著作名、自由词、出版年)抽出来,

作为索引标识,按某种顺序重新加以组织后得到的一

种文档。

5,什么是精确匹配?什么是局部匹配?

精确匹配:是指要求结果记录(标识)中包含的需求

模式必须与提问式所表达的模式完全匹配,才能作为

命中结果输出。局部匹配:是指要求结果记录(标识)

中包含的需求模式与提问式所表达的模式部分匹配,

即为命中。

6.记录:是作为一个单位来处理的有关数据的集合,

是对某一实体的属性进行描述的结果。字段:是记录

的下级数据单位,用来描述实体的某一属性

7,信息检索系统的物理结构有哪些优缺点?

1)集中式检索系统:是资源在空间上集中配置的系统,

单机检索系统是典型的集中式系统,它将软件、数据

和主要外部设备集中在一套计算机系统之中。优点:

信息资源集中,便于管理,资源利用率高;专业人员

相对集中,有利于发挥其作用。缺点:维护代价大,

系统的安全性差,一旦主机出现故障,可能导致整个

系统的瘫痪。

2)分布式检索系统:是指通过计算机网络把分布在不

同地点的计算机硬件、软件、数据库等设备和资源联

系在一起,以服务于一个共同的系统目标而实现的相

互通信、互操作的资源共享的系统。优点:可根据用

户应用需求来配置资源,提高系统对用户检索需求和

环境变化的应变能力,且便于扩展,具有较强的健壮

性,在网络上某一节点的故障不会以其他节点系统的

工作。缺点:越来越多的检索系统寻求基于分布式协

作工作模式的检索服务解决方案。

第四章

1,截词检索主要有哪些类型?

截词检索预防漏检提高查全率的一种常用检索技术。作为一种后控制措施,目前大多数检索都提供有截词检索能力。截词检索有多种不同方式,按照截词的位置来分,截词右有后截断、前截断、中截断三种类型;按照截断的字符数量来分,可分为有限截断、无限截断两种类型。例如:后截词检索:具有隐含的“逻辑或”(OR)运算特性

2,位置算符(nW)和(nN)的运算含义分别是什么?(1)(nW)在检索式中nw所连接的两个检索词必须在文本信息中按照前后顺序紧挨着出现,两个检索词之间的相互距离不超过n个单词(或汉字)。

(2)(nN)在检索式中nN所连接的两个检索词必须在文本信息中紧挨着出现,两个检索词之间的相互距离不超过n个单词(或汉字)

4,聚类检索的基本算法思想是什么?

实施过程:(1)文档聚类(2)聚类检索,2个步骤,P71;聚类检索的实施,首先要以系统中的文献聚类处理为基础。而文献聚类,则是指针对系统中的全部文献向量,使用一定的相似性(或相异性)度量指标和聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献聚集在一起,形成一个个的文献类目,进而生成文献的聚类文档(cluster file)。聚类检索针对文献的聚类文档进行,只需在已经确定的、与提问向量最相关的文献类目内部进行访问匹配

5,目前常见的布尔检索式的变换处理方法有哪些?有何特点?

常见的有逆波兰变换法、准波兰变换法、范式变换法。逆波兰变换法:投入使用最早,影响最大主要的处理思想是:先将检索式(一般为中缀表达形式)转换成等价的逆波兰式(即后缀表达形式)然后将逆波兰式翻译成一组检索指令。特点:逆波兰式的特点在于运算对象顺序不变,运算符号位置反映运算顺序

6目前有哪些连接辅助检索技术:

链接技术、排序输出、随机聚类、去重合并。7.写逆波兰式

1)A+B*C ------- ABC*+

2)(A+B)*(C+D)+E ----- AB+CD+*E+

3)A+B*(C+D+E)+F----- ABCDE++*+F+

4)(A+B)*C+D*(E-F)----- AB+C* DEF-*+

第六章信息检索系统的用户界面

1,用户检索行为:指用户为获取所需信息,在与检索

系统交互过程中的一系列身体活动和心理活动。

主要包括:检索前提问式的构造、重构检索式、提问

式的长度、布尔算符的使用、短语的使用、截词算符

及位置算符的使用、相关性反馈、检索策略、检索类

型、检索问题的解决、检索结果的评价、检索周期、

由任务类型决定的检索时间和检索方式的选择。

2,用户友好信息检索界面的体现方面是:能够理解用

户的查询意图;能够适应用户的认知和操作行为;能

帮助用户有效使用系统;能迅速准确地找到所需信息;

能够以用户最习惯或方便的方式向用户提供结果信

息;无需太多的学习和训练。

3,用户界面在信息检索中有何功能:

1)帮助用户理解和表达信息需求

2)帮助用户构造检索式、拟定检索策略

3)帮助用户选择有效的信息源

4)帮助用户理解和控制检索结果

5)帮助用户跟踪检索过程

4,按照人机交互方式划分的检索界面有哪些?

1)命令语言界面,是指以命令语言进行人机交互的界

面。

2)表格填充与菜单选择界面,是指通过用户填充表格

或选择菜单项,与系统进行交互,实施检索过程。

3)直接操纵界面,可以替代命令式句法的方法。

4)自然语言界面,指通过自然语言实施人机交互的

形式,以自然语言交互为主要交互形式的界面即

为自然语言界面。

第七章信息检索的策略与步骤

1,用户信息需求的层次?

米扎罗在论述信息检索的相关性问题时,提出用户的

信息需求可以分成四个层次:

1)是用户潜在的真实的信息需求;

2)是用户意识到或感知到的信息需求;

3)是用户表达出的信息需求;

4)是当用户进入某信息检索系统进行具体的查询操

作时,把已经用自然语言表达出的信息请求转换成符

合检索系统语法要求的提问式。

2,检索策略:为实现检索目标而制定的全盘计划和

方案,是对整个检索过程的谋划和指导。

3,常用计算机信息检索策略有哪些?3个:(1)积

木型(build-block)策略—查全率:把用户的检索请求

或检索课题剖析成若干个不同的概念面,先分别对这

几个概念面进行检索,并在每个概念面中尽可能全和

多地列举相关词、同义词、近义词,并用布尔算符“OR”

连接成子检索式,然后再用布尔算符“AND”把所有

子检索式连接起来,构成一个总检索式。

(2)引文珠形增长(citation pear-growing)策略—查

准率:从已知的关于检索问题的少数几个专指词开始

检索,以便至少检出一篇命中文献或一条相关信息,

然后审阅这批文献或信息条目,从中选出一些新的相

关检索词,补充到检索式中去。

(3)逐次分馏(successive fractions)策略:先确定一

个相当大的、范围较广的检索初始对象集合,然后提

高检索的专指度,得到一个较小的命中结果集合;继

续提高检索式的专指度,一步一步缩小命中结果集合,

知道得到数量适宜、用户满意的结果为止。

4,受控词汇的选择及优点:

受控词汇:是一种经过检索系统规范化处理的检索词

汇,它们一般取自标题表、叙词表、分类表等词汇工

具。优点:(1)容易准确地选择宽度适当的检索词,

能全面理解该检索词所代表的概念以及和其他检索词所代表的概念之间的关系,便于调节检索范围;(2)使用受控检索词进行检索时,检索者的智力负担比较小,容易获得较理想的检索结果。

5,如何使用扩检?查全率、查准率提高方法,怎么做?1)一般来说,对于需要较高查全率的检索课题,可以从扩检入手,检索式的调整可以选用以下方法:(1)降低检索词的专指度;(2)扩大检索式的网罗度;(3)实施族性检索;(4)进行截词检索;(5)取消某些限制过严的检索条件。

2)对于需要较高查准率的检索课题,一般可以在一定查全率的基础上进行缩检,可以使用的方法有:(1)提高检索式的专指度;(2)用AND连接一些进一步限定主题概念的相关检索项;(3)进行字段限制检索,或用位置算符控制检索词的顺序与出现位置;(4)利用NOT限制,排除不相关的;(5)对检索结果的外部特征进行限制;(6)进行二次检索或后处理检索结果。

6,名词解释

1)检索式:计算机信息检索中用来表示用户检索提问的逻辑表达式,一般由检索词和各种布尔逻辑符、位置算符、截词符以及系统规定的其他组配连接符号组成。

2)检索词:表达信息需求和检索课题内容的基本单元,与系统中有关数据库进行匹配运算的基本单元,是构造检索式的物质基础。

第八章常用信息检索系统及其使用(一)

1,ISI引文索引数据库收录科学期刊的标准有哪些?影响因子、即年指标

(1)影响因子:指期刊所载论文的平均被引率,等于该刊给定时期内的总被引量与可引文献量之比。具体的算法是:该年引用该刊前两年论文的总数除以前两年所发论文总数。(2)即年指标:指当年发表的论文当年被引的次数,

是评价期刊论文被利用速度的指标。

2,何谓JCR,它的主要功能是什么?

JCR(Journal Citation Reports)全称为期刊引用报告服

务,是一个独特的综合性、多学科期刊统计报告,它

以期刊论文间的引证关系为基点,以年为单位,系统、

客观地统计ISI数据库收录期刊当年所载论文的数量、

论文的引用文献数量、论文被引用次数等原始数据,

进而计算出期刊的影响因子、即年指数、被引半衰期

等反映期刊质量的定量指标;是科学家和图书情报部

门选择特定学科领域核心期刊的重要参考依据,是期

刊学术质量评价的重要统计依据。

第十章,网络信息的组织与检索

1,搜索引擎的基本结构如何?

(1)数据采集:负责按照一定的方式和要求对网络上

的WWW站点等资源进行搜集,并将搜集的WWW网

页信息经过网络传输,存储到搜索引擎的搜索端数据

库中。

(2)数据分析:负责对收集到的网页信息进行分析,

按照特定的算法,从中提取有检索或查询价值的内容

(网页关键词、网页的分类类别、被其他网页链接次

数等)。

(3)数据组织:负责形成规范的索引数据库或便于浏

览的层次型分类目录结构。

(4)数据检索:负责帮助用户一定的检索方式来检索

索引数据库或浏览分类目录结构,以获取用户所需的

信息。

(5)信息挖掘:负责提取用户相关信息,以利用这些

信息来提高检索服务的质量。如根据用户以前检索行

为的学习统计及其登记的信息,可以实现个性化检索。

2,网络搜索程序的遍历策略有哪些?深度优先、宽度

优先(简答)

(1)IP地址搜索策略。

(2)深度优先搜索策略:它的目的是要到达被搜索结

构的叶节点,在一个HTML文件中,当一个超链接被

选择后,被链接的HTML文件将执行深度优先搜索,

即在搜索其余的超链接结果之前必须先完整地搜索单

独的一条链。

(3)宽度优先搜索策略:是当前大多数Robert采用

的便利策略,因为它容易实现,而且具备大多数所期

望的功能。(4)深度—宽度结合搜索策略。

(5)启发式搜索策略。

3,元搜索引擎的基本结构如何?P195

它的基本原理是调用各独立搜索引擎进行检索,并提

供统一的用户界面和结果输出,因此,可将其按照功

能分为三大部分:用户接口、查询代表和结果汇总。

1)用户接口:是用户浏览器与元搜索引擎交互的界面。

元搜索引擎采用统一的检索界面,供用户输入查询请

求,将检索请求分发给各成员搜索引擎,完成查询请

求转换,分别生成适用于不同独立搜索引擎的特定查

询语言。

2)查询代理:负责元搜索引擎和相应的独立搜索引

擎的交互,以获得用户需要的查询结果。

3)汇总输出:负责把各个查询代理获得的检索结果

统一起来,进行必要的调整,然后从中选择最能满足

用户需要的查询结果,以标准页面形式呈现。

4,搜索引擎:指利用网络自动搜索软件或人工方式,

对万维网信息资源进行采集、分析与标引,并将索引

信息组织成数据库,以网站形式为网络用户提供检查

服务的一类信息服务系统。

第十二章信息检索评价研究

1,什么是信息检索的查全率和查准率?他们的计算公

式是什么?

信息检索的查全率:(Recall Ratio,简称R)是衡量系

统在实施某一检索作业时检出相关文献能力的一种测

度指标,其计算机方法为:Recall=检出的相关文献量/检索系统中的相关文献总量=a/(a+c)

信息检索的查准率:(Precision Ratio,简称P)是衡量系统的在实施某一检索作业时检索精确度的一个测度指标,其计算方法有:Precision=检出的相关文献量/检出的文献总量=a/(a+b)

2,目前主要的查全率和查准率的替代性计算指标是平均查全率和平均查准率;平均查全率和平均查准率的具体计算方法有3点平均值计算和11点平均值计算两种方式。

3,研究人员对搜索引擎的性能评价问题已进行了广泛的探讨,其中常用的性能价指标主要涉及以下8个方面:(1)数据库规模与内容。具体的考察因素(或指标)包括:收录范围、数据库内容、更新频率、重复率、死链接率等。(2)索引方法。主要考察的内容包括;索引方式(自动还是人工)、索引范围与深度等。(3)检索功能。主要包括两大方法:基本检索功能(包括布尔检索、截词检索、位置/短语检索、限制检索等)和高级(或辅助)检索功能(包括概念检索、相似检索、多语种检索等)。(4)检索结果处理。主要考察指标包括:排序方式、显示内容/格式、后台处理功能(例如摘要、聚类、翻译等)。(5)分类功能。主要涉及内容包括:分类类目体系的深度、数量、合理性等。(6)用户界面。主要考虑的因素包括:界面布局、联机帮助、界面定制、界面广告量等。

(7)汉字处理。需要考虑的具体方面包括:词语切分、多内码处理/转换、中英文混合检索等。

(8)其他(例如响应时间、系统稳定性等)。

科技信息检索

科技信息检索 1、信息资源的类型、基本特征 答:类型:信息资源类型(开发程度): 1潜在信息资源 2现实信息资源(包括口语信息资源、体语信息资源、文献信息资源、实物信息资源) 基本特征:共享性、时效性、增值性、智能性、无限性与有限性并存。 2、电子信息资源的特点、几种划分形式(了解) 答:特点:1、存储形式多样化2、资源数字化3、可交流程度高、 4、方便利用 5、内容丰富 6、载体容量大 划分形式:(网络协议):1.Web信息资源、2.Telnet信息资源、3.FTP信息资源、 4.用户服务组信息资源、 5.用户服务组信息资源、 6.Gopher信息资源 3、电子期刊的几种不同形式(书上没有找到,期刊上的,有谁知道补充一下) 答:一、按载体类型可以把电子期刊分成软盘期刊、光盘期刊、联机期刊、网络化电子期刊。 二、电子期刊也可以分成全文型、摘要型、索引型3种类型。 三、按检索方式来分,电子期刊可分为联机(On-line)检索型电子期刊和单机(Stand alone)检索型电子期刊。 四、按期刊包含的媒体类型的多少,可以把电子期刊分成单媒体电子期刊和多媒体电子期刊两种类型。 4、会议文献、科技报告、标准文献、专利文献、学位论文 答:会议文献:指在专业学术会议上宣读或书面交流的论文、学术报告、会议纪要等文献。 科技报告:是特种文献出版物。指各学术团体、科研机构、大学研究所的研究报告及其研究过程的真实记录,理论性强,但保密性差,难以获取。 标准文献:又称标准资料,是指有产品或工程的质量、规格、生产过程、检验方法等标准技术性文献。 专利文献:指发明人向政府部门(专利局)递交的、说明自己及发明创造的技术文件,同时也是实现发明所有权的法律性文件。 学位论文:指高等学校、科研机构的毕业生为取得学位在导师的指导下完成的学术性研究论文。 5、(加工深度)零次文献、一次文献、二次文献、三次文献的概念,并举例。 答:零次文献:也叫灰色文献,是指未经公开发表或为流于社会的文献。如:私人笔记、设计草图、实验记录、文章草稿、会议记录、书信文书等。 一次文献:又称原始文献,是指以著者本人的研究成果为依据撰写并公开发表或出版的文献。 如:期刊论文、科技报告、专利说明书、会议论文、学位论文等。 二次文献:也叫检索工具,是指将大量分散的无组织的一次文献经浓缩、加工、整理后形成的文献。如:目录、题录、文摘、索引等。 三次文献:也称工具书指工具书,是指在一次文献、二次文献的基础上,经过综合分析而编写出来的文献。如:专题述评、动态综述、学科年度报告、进展报告、数据手册、百科全书等参考工具书。

科技信息检索题答案

信息检索实习报告 学院:计算机与控制工程学院 班级:计本081 姓名:毕玉芳 学号:2008021001 指导教师:杜君 刘卓然 日期:2011-11-6

科技信息检索实习题 一、中文数据库检索 1.在CNKI“中国学术期刊网络出版总库”中分别用篇名、关键词、主题、摘要、全文字段查找本专业某一课题的论文,比较检索结果的数量有什么不同,哪个字段最多,哪个字段最少,你认为使用哪个字段检索查准率最高? 答: 全文字段检索的最多,篇名检索的最少。篇名字段查准率最高。 2.利用CNKI“中国学术期刊网络出版总库”查找本专业教师在核心期刊上发表的论文,请记录两篇本专业的论文题目、作者、刊名和年期。 答:

3. 分析课题“全球气候变化对我国生态环境的影响”,并完成以下题目: 1)写出该课题的逻辑检索式; SU=全球气候变化*生态环境*影响*我国 2)根据你的逻辑检索式,在CNKI“中国学术期刊网络出版总库”中检索该课题,写出检索结果数目; 3)在检索结果中任选一篇文章,写出该篇文章的篇名、作者、刊名、中文关键词(写一个即可)、英文关键词(写一个即可)。

4.利用学位论文数据库查找近五年某大学本专业的硕士学位论文一篇,请记录论文篇名、作者姓名,学位授予单位和导师姓名;该导师指导完成的学位论文有多少篇?列举其中两篇学位论文的题目和作者。

5.利用CNKI“中国工具书网络出版总库”查找本专业一名词术语。 6.利用CNKI“中国工具书网络出版总库”查找有关本专业的工具书,请列举两种工具书的书名、作者和出版者。

7.请利用重庆维普数据库查出两种本专业核心期刊的联系方式(如主办单位、出版地、电话、邮编等)。 8. 利用维普数据库“文献引证追踪”模块查找齐齐哈尔大学某教师论文被引用情况,请记录其中一篇论文的被引量并列举两条引证文献的简要信息(题名、作者、年代和出处)。

专业技术人员学术论文写作与信息检索答案

单项选择题 第1题:学术论文选题的原则有价值性原则、创新性原则和()。 A:实践性原则 B:适宜性原则 C:通俗化原则 第2题:工程实践型学术论文的结构应包括引言或工程背景、()以及总结。 A:工程实践的可行性论证 B:工程实践的方法、步骤、注意事项和结果 C:工程实践的后续发展展望 第3题:论证型论文的结构主要包括序论、本论和( )三部分。 A:导论 B:余论 C:结论 第4题:论文观点错误主要有基本观点错误和()两种情况。 A:观点与大多数人的观点相冲突 B:观点主观片面 C:观点过于超前 第5题:理论研究型论文的特点主要有:内容上的概括性与说理性、严密的逻辑以及()。 A:深刻的思想性 B:直接表述作者的思想观点 C:材料的丰富性 第6题:论文联合署名时,应按()的顺序排列。 A:贡献大小 B:职务高低 C:职称高低

第7题:论文写作信息材料的整理方法主要有逻辑分析法、系统分析法和()。 A:内容归类法 B:概率研究法 C:整体分析法 第8题:注释可分为篇名注、作者注、文中释义性注释和()。 A:引文注释 B:观点注释 C:内容注释 第9题:学术论文选题不仅要遵从价值性原则和适宜性原则,而且还应遵守()原则。 A:实践性 B:创新性 C:思想性 第10题:工具书可分为检索性工具书()。 A:应用性工具书 B:查阅性工具书 C:参考性工具书 二、多项选择题 第11题:学术论文关键词的词性主要包括()。 A:名词 B:动名词 C:名词性词组 D:形容词 第12题:学术论文初稿写作的方法主要有()。 A:个案分析法 B:比较寻疑法

C:追溯验证法 D:实践应用法 第13题:学术论文写作的特征主要有()。 A:实践性 B:科学性 C:规范性 D:可读性 第14题:学术论文摘要一般包括研究目的、研究对象、()等内容。 A:研究方法 B:研究结果 C:所得结论 D:结论的适用范围 第15题:学术论文署名者应具备的条件有()。 A:学术论文的直接责任者 B:做出主要贡献者 C:学术论文撰写者 D:学术论文的构思、论证或执笔者 第16题:中国知网数据库检索方式可分为()。 A:初级检索 B:二次检索 C:精确检索 D:高级检索 第17题:文献综述除了包括介绍相关领域研究现状外,还应该有()等内容。 A:说明用什么方法解决所提出的问题

信息检索技术论文

期末课程论文 论文标题:基于音频的信息检索 课程名称:信息检索技术 课程编号:1220500 学生姓名:潘国伟 学生学号:1100310220 所在学院:计算机科学与工程学院 学习专业:计算机科学与技术 课程教师:王冲 2013年7月3 日

引言: 进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息检索逐步转向针对内容的基于知识的信息检索。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。目前一些基于文本的Web引擎,如Google,Baidu,功能已非常强大,但还缺乏比较实用的音频搜索引擎。Internet上的多媒体流非常巨大,需要一些高效的搜索引擎从浩如烟海的数据中找出需要的信息。另外,音频检索在辅助视频检索和卡拉OK检索系统以及军事、刑侦领域方面都有巨大的应用价值和广阔的研究前景。 基于内容的音频检基索关键技术 问题: 传统的方法,其主要缺点有: 一是当数据量越来越多时,人工注释的工作量加大; 二是人对音频的感知有时难以用文字注释表达清楚,人工注释存在不完整性和主观性; 三是不能支持实时音频数据流的检索。 这里主要综述了音频检索方法,讨论了一些音频检索中的关键技术:音频特征提取、音频分类、语音识别技术等。 总体介绍:

语音识别技术概述 语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:

信息检索技术习题答案

《信息检索技术》(第三版)书后习题及参考答案(部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规范化词语来表达文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。 6.检索工具按信息加工的手段可以分文__________、____________、___________。 7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。 8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。 答案1.零次,一次,二次,三次 2.参考文献,引文 3.内容特征 4.检索提问词,文献记录标引词 5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文 6.手工检索工具,机械检索工具,计算机检索工具 7.五,22 8.索引款目,编排方法 二、判断题 1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。() 2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。() 3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。() 4.请判断下面图书的国际标准书号的格式是否正确。ISBN:978-030-26151-X。() 5.文献的专利号、报告号、合同号、标准号、索取号、国际标准书号、刊号属于文献的内部特征。 6.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 答案1.√2.×3.×4.√5.√6.× 三、选择题(单选或多选)

信息检索技术方法及搜索引擎

信息检索技术方法及搜索引擎.txt 1 截词检索技术 2 邻近检索技术 3 字段检索技术 4 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索 方法. 主要的布尔逻辑关系词有:逻辑与(AND),逻辑或(OR),逻辑非(NOT) 1 布尔逻辑检索技术 逻辑与 逻辑乘: "and"或"*"表示 组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记 录才算命中信息 作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率. 逻辑或 又称逻辑和:"or","+" 组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A,B两词的文章. 作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率. 逻辑非 又称逻辑差: "not" "-" 组配方式:A-B,表示检索出含有A词而不含有B 词的文章. 作用:逻辑非用于排除不希望出现的检索词,它和"*"的作用相似,能够缩小命中文献范围,增 强检索的准确性. 例如检索:"打印机驱动程序" 查询关键词:打印机,驱动程序 检索表达式:打印机 AND 驱动程序 例如检索:"微型计算机"方面的有关信息 查询关键词:微型计算机,微机 检索表达式:微型计算机OR 微机 布尔逻辑检索举例 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT > AND > OR 例:检索"唐宋诗歌"的有关信息. 关键词:唐,宋,诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌; 错误表达式: 唐 OR 宋AND诗歌; 唐 AND 宋AND诗歌;

科技信息检索大作业西电

科技信息检索大作业西 电 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

《科技信息检索课》检索实验报告 上课时间:周四 姓名:XXX 学号: XXXXXXXXXX 班级:XXXXXX 名单中的序号:XX

《科技信息检索》考核题 (2015年下学期) 一、简答题(60分) 1.在我校图书馆网站,通过“馆藏书刊”栏目,完成检索式:“题名=计算机 网络 and 出版社=清华大学”的中文图书检索,要求书名为精确匹配,请写出检索结果共多少写出检索步骤,及该类图书的中图分类号。 答:33;高级检索,计算机网络 and 出版社=清华大学。 2. 我校采购的国外全文类系统平台(数据库)有哪些检索类系统平台(二次 文献库)有哪些 答:ACM 期刊/会议论文数据库、AIP全文期刊数据库(国家科技图书文献中心赞助购买)、 ASME全文期刊数据库APS全文期刊数据库、大英百科(EB)全书、EBSCO期刊全文/文摘数据库、Academic Search Premier(简称ASP)全文库、 Business Source Premier (简称BSP)全文库、Engineering Village(EI Compendex--Inspec--NTIS)(1970年-) Elsevier全文电子期刊 (2004年-)、Emerald电子期刊全文库、Emerald电子系列丛书(工商管理与经济学专辑)、IEL期刊/会议/图书/标准全文库(1988年-)、John Wiley全文期刊数据库 (1997年-)、NTIS(美国政府科技报告) (1964-2011)、国外科技报告全文服务系统(用户名:guest密码:guest)、OCLC数据库 (全国登录并发16个,单馆并发1个)、OSA电子期刊和会议库、PQDT-B(美国博硕士论文文摘)、ProQuest国外学位论文全文数据库 (1997年-)、Safari IT类电子图书、Science美国科学周刊 new 、SIAM电子图书(-2011年)、Springer英文电子图书与丛书(图书2005-;丛书1997-) Springer全文电子期刊 (1997年-)、WOS平台数据库-SCI,SSCI,CPCI- S,CPCI-SSH、WOS-ESI(旧平台),WOS-JCR(旧平台)、WOS-InCites科研评价工具(旧平台)、WOS-ESI(新平台),WOS-JCR(新平台)、WOS-InCites科研评价工具(新平台)、Nature《自然》电子版期刊、电子科技文献综合数据库(国外)、SAGE多学科人文电子书数据库、百链文献资源共享平台(外文资料一站式检索与文献传递) 、Presdisplay国外2000余种报纸库、T&F科技期刊回溯数据库(-2000)。 3.预了解某个理论或概念有没有被应用到其他的领域中去被哪个国家的哪些研 究人员应用解决了哪些领域的问题取得了哪些研究成果你知道有什么工具和方法可以检索这方面的需要,请写出数据系统(平台)的名称,具体的检索思路和检索步骤。 答:可以在cnki NSTL EI SCI ISTP NTIS等数据库中进行检索; 1)确定该理论或概念的关键词 2)确定文献范围(国家、领域) 3)确定检索式,在平台上进行检索

文献检索的方法

文献检索的方法 一、文献检索方法 查找文献的方法分为如下三种: 1. 直接法 直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 (1)顺查法 按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 (3)抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2. 追溯法 不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献。 3. 综合法

综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理。 二、文献检索途径 检索工具有多种索引,可以提供多种检索途径。一般来讲,检索途径可以分为以下四种:分类途径、主题途径、著者途径和其他途径。 1. 分类途径 分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。 分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。一些检索工具如《中文科技资料目录》是按分类编排的,可以按照分类进行查找。 2. 主题途径 主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念,是一种主要的检索途径。 3. 著者途径 著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引。 4. 其他途径

科技信息检索报告

江苏理工学院 信息检索报告 年级专业 10软件1W 学 号 10144107 姓 名 董 鑫 指导老师 武群辉

《科技信息检索》课程考核大作业 说明:1.考核方式:开卷 2.考核要求:独立完成,不得抄袭。答题时间限于一周内。 3.提交方式:A4纸打印,由学委收齐、按学号整序后交给任 课老师。 1. 拟定检索课题:根据自己的专业和兴趣自拟一个课题名称(5 分) 答:java语言的发展历程 2. 分析课题: 按自拟的论文题目进行初检,对检索结果进行粗略分析,分析所选题目是否可行,若所选题目研究众多,则应选择适当角度修订自己的选题,将分析定题的过程稍加说明。(10分) 答:开始以java语言的发展历程作为篇名粗略检索,条目较多。随后设定时间,并含模式识别再次检索,条目清晰。 3.编制检索策略,检索策略包含以下内容: 拟定选用的检索工具(系统)(至少2种)(5分): 答:中国期刊网全文数据库、万方学术期刊全文数据库 检索时间范围(5分): 答:2007年-2013年、2007年-2013年、2007年-2013年 拟定检索词(3~5个)(5分): 答:java、计算机语言、发展历程 编制检索式(检索式构成:[检索途径1(入口)=检索词1]逻辑运算符[检索途径2(入口)=检索词2]逻辑运算符[检索途径3(入口)=检索词3]……)(10分): 答:中国期刊网全文数据库的途径 篇名=java语言的发展历程&&关键词=模式识别&&摘要=应用 万方学术期刊全文数据库的途径 题名或关键词=java语言的发展历程&&关键词=模式识别&&题名=应用

说明所选检索工具(系统)的类型(如:目录、索引、文摘……),写出原文获得的途径(5分): 答:中国期刊网全文数据库 途径 篇名&&关键词&&摘要 万方学术期刊全文数据库 途径 题名或关键词&&关键词&&题名 4.检索操作,并按要求记录相应的检索结果: (1)简述检索步骤(10分): 答:⒈常用数据库→中国期刊网全文数据库 ⒉高级检索→篇名=java语言的发展历程&&关键词=模式识别&&摘要=应用 ⒊年限:从2007年到2013年 ⒋来源类别:全部期刊 ⒌条目9即为所查询的期刊:java语言的发展历程 同理, ⒈常用数据库→万方学术期刊全文数据库 ⒉高级检索→题名或关键词=java语言的发展历程&&关键词=模式识别&&题名=应用 ⒊年限:从2007年到2013年 ⒋来源类别:期刊论文、学位论文、会议论文、外文期刊、外文会议 ⒌条目4即为所查询的期刊:java发展史 (2)根据检索策略进行检索,针对检出文献数量的多少、检索结果的相关性等进行分析(15分): 答:以篇名“java语言的发展历程”为搜索途径,条目众多,有2376条。 选定年限为2007年-2013年,加上关键词“模式识别”和摘要“应用”再次检索,条目为24条,条目的数量较为合理。 同理, 以题名或关键词“java语言的发展历程”为搜索途径,条目众多,有64243条。 选定年限为2007年-2013年,加上关键词“模式识别”和题名“应用”再次检索,条目为23条,条目的数量较为合理。 (3)按照标准著录格式(格式见教材附录二 10“参考文献页”)记录与课题相关的参考文献,要求从:图书、学位论文、期刊论文(至

科技信息检索期末考试

文献检索

二:课题研究现状考察 1、课题相关专业方向研究现状以及主要思想或方法(附参考文献名称、日期、发表刊物、来源; 主要文献不少于10篇,其中英文至少3篇) 研究现状:铝酸盐水泥目前可以达到500度的高温极限,在稠油热采井中应用较为普遍。而我们需要可以忍受700度及以上高温的固井技术。 思想和方法:根据水泥的高温机理以及加热井况来设计合理的水泥浆体系和开采工艺,采用合适的固井工具,使之满足热采工艺的需求。 参考文献: 李早元, 郭小阳, 杨远光, 等. 新型耐高温水泥用于热采井固井初探[J]. 西南石油学院学报, 2001, 23(4): 29-32. 沙林浩, 高永会, 燕平, 等. 河南油田新庄, 杨楼区块稠油热采井固井水泥浆[J]. 钻井液与完井液, 2007, 24(5): 41-43. 李鹏晓, 孙富全, 曾建国. 稠油热采井固井技术的研究进展[J]. 天津科技, 2010 (5): 11-13. 武治强, 李早元, 程小伟. 稠油热采井井固井水泥石耐高温研究初探[J]. 2010 年固井技术研讨会论文集, 2010: 43-45. 冯少波. 注蒸汽井温度场分布和套管热应力分析[D]. 西南石油学院, 2002. Savage K D. Method of heating an oil shale formation: U.S. Patent 4,524,826[P]. 1985-6-25. Michael P. Process of recovering oil and dawsonite from oil shale: U.S. Patent 3,502,372[P]. 1970-3-24. Pressure pulsing perpendicular permeability process for winning stabilized primary volatiles from oil shale in situ: U.S. Patent 3,273,640[P]. 1966-9-20. Fisher F R, Pelzer H L. Thermal process for in-situ decomposition of oil shale: U.S. Patent 2,780,449[P]. 1957-2-5. Grady D E, Kipp M E. Continuum modelling of explosive fracture in oil shale[C]//International Journal of Rock Mechanics and Mining Sciences & Geomechanics Abstracts. Pergamon, 1980, 17(3): 147-157. Spitz R D, V 2、课题相关专业方向研究代表人物(或机构)以及主要著作(附著作名称、日期、发表刊物、来 源),主要参考文献不少于10篇,其中英文文献不少于5篇) 答: 冯少波. 注蒸汽井温度场分布和套管热应力分析[D]. 西南石油学院, 2002. 李子丰, 阳鑫军, 王兆运, 等. 防止热采井套管热破坏的预压固井技术[J]. 工程力学, 2008, 25(6): 219-224. 张永贵. 注蒸汽热采井套管强度理论与试验研究[D][D]. 燕山大学, 2007. 王小兵, 李开菊. 泡沫水泥浆固井技术在草桥地区的应用[J]. 石油钻探技术, 2002, 30(4): 32-33. 程小伟, 王岩, 李早元, 等. 稠油热采条件下矿渣对磷铝酸盐水泥石耐高温性影响研究[J]. 硅酸盐通报, 2013, 32(11): 2302-2305. 刘勇, 张清玉, 谢承斌, 等. 低密度高强度水泥浆在哈萨克斯坦油田热采井的应用[J]. 钻井液与完井液, 2010, 27(5): 68-70. 李子丰, 阳鑫军, 王兆运, 等. 防止热采井套管热破坏的预膨胀固井技术[J]. 固体力学学报, 2009, 30(2): 162-169. 李强. 油页岩原位热裂解温度场数值模拟及实验研究[D]. 博士学位论文, 2012. 高孝巧, 杨浩, 熊繁升, 等. 油页岩原位加热井下温度场及热应力研究[J]. 断块油气田, 2014, 21(3):

《信息检索技术》书中答案

《信息检索技术》书后习题及参考答案(部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规化词语来表达文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题容进行检索的途径,利用能代表文献容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。 6.检索工具按信息加工的手段可以分文__________、____________、___________。 7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。 8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。 答案1.零次,一次,二次,三次 2.参考文献,引文 3.容特征 4.检索提问词,文献记录标引词 5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文 6.手工检索工具,机械检索工具,计算机检索工具 7.五,22 8.索引款目,编排方法 二、判断题 1.在检索信息时,使用逻辑符“AND”可以缩小收缩围。() 2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。() 3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。() 4.请判断下面图书的国际标准书号的格式是否正确。ISBN:978-030-26151-X。() 5.文献的专利号、报告号、合同号、标准号、索取号、国际标准书号、刊号属于文献的部特征。 6.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 答案1.√2.×3.×4.√5.√6.× 三、选择题(单选或多选)

科技信息检索报告

科技信息检索报告 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

《科技信息检索》实习报告数据库:1.中国知网数据库(CNKI) 2.工程索引数据库(Ei Compendex) 3.SDOL数据库 学生姓名:学号: 专业班级:指导教师: 提交日期: CNKI实习报告 一.检索课题 1.名称:基于模糊PID控制的锅炉汽包水位控制系统。 2.分析:据课题涉及的内容,确定三个检索主题,分别为“PID”、“模糊控制”和“汽包水位”;根据检索需要,选择发表时间为“2000年至2016年”。 二.跨库检索 多概念主题组配检索: (1)进入中国知网主页后,点击“高级检索”,进入高级检索页面,点击“跨库检索”,点击“全选”。 (2)输入主题:“PID”并且“模糊控制”并且“汽包水位”,全部选择“模糊”匹配。发表时间选择“从2000年1月1日到2016年4月1日”。其余选项默认。点击“检索”,共找到201条结果,如图: (3)自认为检索结果太少,不利于寻找合适的文献。为扩大检索范围,将主题之一的“汽包水位”调整为“水位”,其余均不变。点击“检索”,共找到375条结果,如图: (4)根据需要,选择5条文献并在其前打对勾,点击“导出/参考文献”,如图: (5)在5条文献前全部打对勾,再次点击“导出/参考文献”,然后按,结果如下:

[1]陈平. 锅炉汽包水位模糊PID控制的研究[D].华侨大学,2006. [2]王芳. 模糊自调整PID控制在锅炉汽包水位控制中的应用[D].山东大学, 2007. [3]唐令波,雷玉勇,邴龙健,蔡黎明. 基于模糊PID的工业锅炉汽包水位控制系统的仿真研究[J]. 机械设计与制造,2009,11:110-112. [4]鄢波,丁维明,魏海坤. 工业锅炉汽包水位模糊自适应PID控制系统[J]. 发电设备,2006,04:276-279. [5]刘涛. 基于模糊PID控制的锅炉汽包水位控制系统的研究[D].新疆大学, 2009. 三.期刊单库检索 多概念主题组配检索: (1)进入中国知网主页后,点击“高级检索”,进入高级检索页面,鼠标移至“文献”带出下拉菜单,点击“期刊”。 (2)输入主题:“PID”并且“模糊控制”并且“水位”(由跨库检索的经验,直接将“汽包水位”调整为“水位”),全部选择“模糊”匹配。来源类别选择“核心期刊”打对勾。选择“从2000年到2016年”。其余选项默认。点击“检索”,再点击“被引”,共找到60条结果,如图: (3)选择前3条文献并在其前打对勾,点击“导出/参考文献”,如图: (4)在3条文献前全部打对勾,再次点击“导出/参考文献”,然后按,结果如下: [1]刘志远,吕剑虹,陈来九. 智能PID控制器在电厂热工过程控制中的应用前景[J]. 中国电机工程学报,2002,08:129-135. [2]周佳,曹小玲,刘永文. 锅炉汽包水位控制策略的现状分析[J]. 锅炉技术, 2005,03:5-10+71. [3]李慧,刘星桥,李景,陆晓嵩,宦娟. 基于物联网Android平台的水产养殖远程监控系统[J]. 农业工程学报,2013,13:175-181. EI实习报告 一.检索课题 1.名称:基于模糊PID控制的锅炉汽包水位控制系统(和中文数据库检索课题相同)。

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。 (1)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。 (2)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。 (3)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。检索知识包括主题词、分类号、著者、标题、机构、代码等。 (4)信息检索的一般原理:P7 (5)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子

系统、查询子系统、用户与系统交互子系统、匹配子系统)(6)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。 (7)检索系统的功能:报道功能、存储功能、检索功能。(8)信息检索理论:标引理论、检索模型、检索结果的可视化。 (9)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。 第2章信息检索模型 (1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。 (2)信息检索模型的类型:P18 (3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。 (4)布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻

科技信息检索与利用心得

《科技信息检索与利用》心得 知识信息的获取与利用,是一个悠久的话题,每个时代都会赋予其不同的内涵,但是在人类漫长的历史长河中,它从来没有像今天这样广泛而深刻的影响着人们的生活。社会步入了以开发利用知识信息这一智力资源为发展前提的信息时代,以获取与利用知识信息的能力为核心的信息素养对现代人类生存与发展具有极为重要的意义。因此,学习《科技信息检索与利用》这门课程的重要性就显而易见了。而值得庆幸的是,这一学期我们的课程中就有《科技信息检索与利用》这门课程。而在不知不觉中,我们已将《科技信息检索与利用》课程学习完毕。通过对该课程的学习,我在文献检索基础理论和对基本知识认识等方面有了很大的提高,什么是信息素养,身为信息时代的大学生,如何提高信息素养,这都是对自己负责任的研究课题,对各个数据库的了解以及如何检索文献、筛选信息让我们更充分的学习专业性知识,拓宽视野。学习期间,我对这门课的认识经历了很大的变化,也有很多心得体会。 一、学习该课程的必要性 开课前,我认为用百度和谷歌等搜索引擎来完成我们的资料搜索就行了,没必要学习一个科目,现在回想起来发现当时的想法是多么的可笑。进入这所学校我们就是当代大学生,对信息资源需求的广度及深度有更高的要求,百度和谷歌等搜索引擎检索的文章不仅在数量上少,而且专业性差,根本达不到预期的效果。我们从哪里获得我们需要的资源呢?答案显然是各大数据库,对数据库我们相对来说是比较陌生的,我们如何更好的利用这些数据库的资源呢,这就迫切要求我们对这些数据库的利用方法有一个系统的学习与认识,这门课程就很好的解决了这个问题。文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法学,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我们来说,文献检索十分有必要。而且我们必须好好掌握这样一门课程。二、学习信息检索的收获 (一)信息搜索途径的拓展 本来我们在网络上搜索资料,一般都是用的“baidu”、“google”等搜索引擎进行搜索。搜索的资源有限,而且重合率较高,权威性也不高。通过这门课程的学习,我了解到了更广的资源库。比如“中国学术期刊全文数据库”、“中文科技期刊数据库”、“Web of Science数据库”、“化学文摘数据库”等等。这些数据库里面的图书资源和期刊论文资源都非常的宝贵,搜索起来也非常的方便。通过一定的搜索步骤,可以将大量的同主题的图书或期刊一起寻找出来,这很大程度上为我们寻找资料者带来便利。比如“中国学术期刊全文数据库(简称中国期刊网)”,它是我国第一个大型的、多功能的、集成化的电子期刊全文数据库。它提供全文服务,8000多种学术性期刊数字化。为我们搜集资料带来很大帮助。现在,这些数据库已经成为我搜集资料、撰写论文时,经常使用的信息搜集途径了。 (二)信息搜索精确度提高 运用数据库搜索资料,有多种途径。如按篇名或文章题名搜索、按作者或责任者搜索、按作者所在单位搜索、按摘要搜索、按关键词搜索、按分类号搜索等等。这些具体的搜索方式可以适应我们不同的搜索资料的需求。比如在数据库进行搜索时,可以在作者、单位、关键词、时间等方面分别进行设置,这样就可以保证搜索出来的文献都是有价值的、可以加以利用的文件。而在普通搜索引擎中,就达不到这样的效果,有时会因为输入的限制太多,而导致搜索到的文献非常有限。学习信息检索的收获还远不止这两点,如要灵活运用各种检

网络信息检索试题及答案1

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C)特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?(A) A.文摘 B.会议文献 C.辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于(A)。 A.零次文献 B.一次文献 C.二次文献 D.三次文献 9、下列选项中哪一项属于“国内统一刊号”(C)。 A.ISBN7-04-014623-1 B.ISSN0254-4164 https://www.sodocs.net/doc/7e17529536.html,11-2127/TP D.0254-4164/TP 10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C)参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19)[2002-04-15].http:∥www.….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B)参考文献的著录条目描述。 昂温G,昂温P S.外国出版史[M].陈生铮,译.北京:中国书籍出版社,2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

信息检索技术

第一章信息检索概述 1,什么是信息检索?它有哪些主要类型? 信息检索指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。有目的和组织化的信息存取活动,其中包括“存”和“取”两活动。 旧分类方法:文献检索、事实检索、数据检索 新分类方法:文本检索、数值检索、音/视频检索 2,试分析阐述信息检索的基本原理,信息集合、需求集合、匹配与选择,信息检索三阶段及期特点? 答:即信息集合与需求集合的匹配与选择。 (1)信息集合是指有关某一领域的,经采集、加工的信息的集合。形成可供用户访问与检索的对象,在某种意义上说,它是以一种公共知识结构,它有可能弥补某个特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或者提供某种信息区激活人脑中存储的知识。(2)需求集合:用户的信息需求是在社会实践活动中产生的。众多用户不同形态的信息需求的汇集,就形成了需求集合的存在。信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。(3)选择与匹配:面对信息集合与需求集合,如何在两者之间建立起联系与沟通的桥梁,以便能够从信息集合中快速获取用户所需要或所缺少的信息与知识呢?这就需要信息检索提供一种“匹配”机制。它的主要功能在于:能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。这里,我们要求匹配机制至少包括两个要素:一是匹配标准,即相似性标准;二是执行匹配的 动因。 3,信息检索主要经历了哪些不同的发展阶段?各阶段 有何特点? (1)手工检索阶段,主要特点可以概括为印刷文献(图 书、期刊、会议、专利、学位论文)为主要检索对象; 以各类文摘、题录、和目录性工具书为可利用的主要 检索工具;以图书馆的参考咨询部门为开展信息检索 服务的中心机构。(2)计算机化检索阶段(脱机批处 理检索时期、联机实时检索时期、联机网络化与多元 化检索时间),主要特点:以各类机读数据库为检索对 象;各类信息中心,联机服务中心作为新兴的信息服 务部门而存在;信息检索用户逐渐由专业检索人员(检 索中介)向个人终端用户转移和扩散。(3)网络化检 索时期,分布式存储、分布式检索、分布式处理,检 索范围领域广,传统技术与网络技术的结合,用户界 面友好度,检索效率低。 4、名词解释 1)文本检索:指以各种自然语言符号系统所表示的信 息作为主要检索对象的信息检索活动。 2)数值检索:针对数值型数据的查询而发展起来的 一类有特色的信息检索。 3)音视频检索:针对各种数字化音频与视频信息而进 行查询的一类新兴的信息检索操作。 4)信息存储与检索:将信息按照一定的方式组织和存 储起来,并能够根据信息用户的需求找出其中相关信 息的过程。信息检索是一种有目的和组织化的信息存 取活动,其中包括“存”和“取”两活动。 5)文献检索:以文献(包括文献、题目、或全文)为 检索对象的一类信息查询活动,是一种相关性检索。 6)数据检索:以经过选择、整理、鉴定的各种数据信 息的性能参数作为检索对象的一类检索,是一种确定 性检索。 7)事实检索:针对从文献中提取出来的各种事实(或 知识项)所进行的检索活动,是一种确定性检索。 第二章信息源 1,如何鉴别高质量的期刊? 目前国内外公认的鉴别方式有2种:核心期刊和同行 评审期刊。 (1)核心期刊:指的是刊载某一学科或专业有关的信 息较多,且学术水平较高,能够反映该学科最新成果 和前沿动态,受到该专业读者特别关注并成为检索与 阅读首选的那些期刊。 (2)同行评审期刊:它是国内外高水平期刊对来搞评 审普遍采用的方式。具体做法是:作者将文稿寄交编 辑部并经初审合格后,为了审查论文的学术质量需要 将论文稿送交有关专家(即同行)进行评审。 2,我国出版的专利文献有哪些? 目前我国出版的专利文献主要包括专利说明书、专利 公报、专利索引等。既有一次文献,也有二次文献, 他们是: (1)<<发明专利公报>>、<<实用新型专利公报>>和<< 外观设计专利公报>>(每周一次); (2)<<发明专利申请公开说明书>>,<<发明专利申请 审定说明书>>及<<实用新型专利申请说明书>>。 (3)专利年度索引; 3,书目数据库的特点是:信息密度高,文献报道范围 广,数据量大,连续性和积累性强;数据结构简单, 记录格式较为固定,费用低廉;检索途经多,速度快; 更新周期较长。 4,全文数据库的特点:可直接利用;简化数据库标引 和建库工作;避免了文献二次加工中的人为差错;后 处理能力强。 5,名词解释: 1)电子信息源:指以数字化形式(即二进制码)将文 字、图像、声音、动画等存储在光、磁等存储介质上,

相关主题