搜档网
当前位置:搜档网 › 2017第二讲(1)-信息检索概述 二

2017第二讲(1)-信息检索概述 二

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

网络信息检索.

网络信息检索——搜索引擎篇 摘要:概述网络信息检索,主要针对搜索引擎进行比较,参考一些文献来对将来的搜索引擎进行合理的展望。 关键字:网络信息检索搜索引擎发展趋势实时搜索 网络信息检索概述 网络信息检索是指能够通过网络接受用户的查询指令,并向用户提供符合其查询要求的网络信息资源的过程。可以把网络信息检索理解为见多对象为网络信息的信息检索。(西安电子科技大学出版社《网络信息检索》 搜索引擎概述 网络信息检索的应用有搜索引擎,多媒体信息检索,话题识别与跟踪,信息过滤,问题回答五个方面。本文主要讲述搜索引擎的相关内容。 本文所称的搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。用户的查询途径主要包括自由词全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等。 著名搜索引擎Google,百度,yahoo中国 Google是一家美国上市公司(公有股份公司,于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googolplex”,它位于加利福尼亚山景城。Google 创始人Larry Page 和Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为是全球规模最大的搜索引擎。

百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎。它拥有目前世界上最大的中文信息库,总量达到1亿2千万以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(北京有限公司。随后于同年10月成立了深圳分公司。2011年6月又在上海成立了上海办事处。2005年百度在美国的纳斯达克上市,省委当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。 Yahoo中国是网站分类目录的领头军,它以分类目录,网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文,英文等十余种语 言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的,相对独立的搜索引擎。 他们各自信息搜集方式的比较 百度是最典型的一种自动搜索引擎,google是一般典型的自动搜索引擎。他们由一个成为蜘蛛的机器人程序,由四部分组成的自动索引。该搜索引擎的有点事信息量过大,更新及时,不需要人的干预,缺点是搜到信息过多,许多无用信息需要用户行结果中筛选。 Yahoo属于分类搜索引擎。Yahoo并不是单纯地提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成,以一个分层的线性目录来为用户提供按图索骥式的服务。该类搜索引擎因加入了人的智力,所以信息准确,导航质量非常高,不足之处是需要人的介入,维护量大,信息量少,信息更新不及时。 综合各个方面(本文只比较搜寻信息方式的不同,其他方面不加赘述,三大搜索引擎各具千秋。从实用性来说,google的检索功能强大、灵活,尤其是支持多种字段检索以及网页的推荐功能,并可以安用户的习惯设置检索界面;百度收录的中文信息覆盖面广、数量大,更新快,注重服务的本地化;雅虎作为指南型分类检索工具,在相对查全率方面具有优势。我们可以根据各自的生活、工作、学习的需要,选择一种适

网络信息检索

网络信息检索课程教学研究 资环学院09生师彭秀欣 摘要:随着计算机技术、通讯技术、网络技术的迅猛发展,网络信息检索已成为当今信息社会主要检索信息技术对于传统的基础教育影响越来越大,基于网络的教育教学资源剧增,成为高校文献检索课的教学重点。本文分析了《网络信息检索技术》课程的教学现状及未来发展。关键词:改革、现状、网络,优化、发展。 正文:21世纪是一个信息化、网络化的世纪,展现在我们面前的是一个以网络信息技术为核心技术的新的发展时代。网络信息技术已经渗透到社会生活的各个方面,它不仅带来信息传递和利用方式的改变,而且为人们获取和传播信息提供了方便快捷的新途径。利用计算机从网上获取信息已成为当今信息社会的主要检索方式,是当代大学生必须具备的一种素质。网络信息检索技术的发展已向文献检索课提出了严峻的挑战。引进网络信息检索新内容,并逐步建立起以网络信息资源及其检索为核心的新体系。如何利用网络信息资源已成为大学生急需学习的内容,所以,网络信息检索应成为高校文献检索课的重点,网络信息资源极其丰富、种类繁多,但由于信息过于庞大和分散,且变化十分快,给网络信息检索带来了不便,也增加了教学难度。 网络信息检索的教学目的:是要求学生具备利用计算机网络多途径获取各种专业信息的能力,增强学生的网络信息意识。网络信息检索的教学应围绕这个教学目的,紧扣网络信息资源的实用性,针对各学科专业的实际需要,选用重要而实用的核心资源。信息检索课教学的重要作用 信息检索课是一门实践性很强的课程,其检索技能的提高主要是靠对信息检索方法与技能的掌握,并通过举一反三的训练,增强学生对信息检索、获取、分析和评价的能力, 教学内容包括:Internet概述(Internet的起源与发展、Internet在中国、Internet的连接方式、TCP/IP、Internet的域名等);Internet的网络功能(E-mail、Telnet、FTP、Gopher、NetNews、BBS、WWW及其浏览器等)。这一部分教学的目的在于使学生了解和学会网络信息检索的基础知识及基本技能。

信息检索第六章计算机信息检索概

第六章计算机信息检索概述 6.1计算机信息检索的含义和特点 一、计算机信息检索的含义 计算机信息检索:人们根据特定的信息需要,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。包括信息存储过程和信息检索过程。 二、计算机信息检索发展简史 1、脱机批处理检索:20世纪五六十年代是脱机批处理检索的试验和实用化阶段。这一时期,计算机尚未连接通信网和远程终端装置,主要利用计算机进行现刊文献的定题检索和回溯检索。当时的信息检索是脱机批处理检索,即用户向计算机操作人员提问,操作人员对提问内容进行主题分析,编写提问式输入计算机建立用户提问档,按提问档定期对新到的文献进行批量检索,并及时通知用户。同时这一阶段开始利用计算机编辑出版检索性刊物。 2、联机检索阶段:20世纪60-80年代是联机检索的试验和实用化阶段。第三代集成电路计算机,存储介质,存储容量,数据库管理,通信技术的发展为联机检索提供了技术支持。随着国际联机检索系统的发展,信息检索在这一阶段实现了远程实时检索。 3、光盘检索阶段:20世纪80年代以来,新型信息载体激光光盘在信息检索领域得到广泛应用。光盘检索操作方便,不受通信线路影响。早期是单机驱动器和单用户,为解决多用户同时检索的要求,出现了复合式驱动器,自动换盘机,光盘网络技术。 4、网络化联机检索阶段:20世纪80年代以来,随着TCP/IP协议的普遍采用,美国国家科学基金会的接入,计算机检索发展到了今天的网络化联机检索阶段。互联网具有广泛性方便性的特点,使许多联机检索系统纷纷上网,除保留原来服务项目和内容外,还增加了许多新的动态信息服务。同时以搜索引擎为核心的网上搜索技术也日益发展,成为当前最具有普遍意义的信息检索形式。 三、计算机信息检索的分类(不同标准不同类型) 1、根据所检索数据库的形式:①书目检索:查出某一主题的文献条目的检索,包括题录检索,文摘检索等②数据检索:查出有关数据的检索,以求得某一问题量化的准确数值,包括统计数据和科学数据③事实检索:查出有关事件或实在情报,以求得对某一问题的解答。④全文检索:直接利用原始文献建库进行的检索。 2、根据计算机检索服务方式:①定题检索:根据用户检索课题内容,定期从新到资料库中为用户提问进行计算机检索的服务方式。特点:定期性新颖性批处理性②回溯检索:指追索过去的信息,也可用于查找最新信息,能适应多数用户的查询需要。可用于申请专利的新颖性,科研立项的查新,撰写论文和编写教材的信息收集。③日常检索:用户根据自己的信息需求,直接利用终端检索,检索系统即使提供用户所需的信息。 3、根据检索方式:①脱机检索:成批处理检索提问的计算机检索方式,计算机检索的初期类型②联机检索:利用检索终端和通信线路,直接查询检索系统数据库的计算机检索方式③光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索④网络检索:利用检索工具在互联网上进行信息存取的行为,目前主要利用的信息检索系统是搜索引擎。 四、计算机信息检索的特点 手工检索:人们长期以来采用的文献信息检索的传统方法,人们借助简单的机械工具,直接凭头脑进行判断,对记录在普通载体上的资料进行相应的检索。 优点:①直观性强②灵活性高③费用比较低

关于网络信息检索论文

关于网络信息检索论文 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面我为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。 浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1、信息检索概述 信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2、网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,

不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3、网络信息检索的现行模式 3.1网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。 3.2网络搜索引擎检索 搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查

信息检索题库(含答案)

注意: 1、通读教材,根据页码提示完成下列题目。 2、最后一次上机课在线测试,范围不超出如下题 目。 第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D)。A、AD B、PB C、NASA D、DOE{第7页} 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文{第6页} 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献{第6页} 4、了解各个国家政治、经济、科技发展政策的重要信息源是(C)A、科技报告B、政府出版物C、标准文献D、档案文献{第8页} 5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第5页} 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书C、综述D、文摘{第4页} 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述{第4页} 8、以下各项属于二次信息的是(A )A、索引B、期刊C、学位论文D、百科全书{第4页} 二、多选 9、二次信息主要包括(CD)等。A、手册B、年鉴C、目录D、题录{第4页} 10、信息的属性包括(ABCD)A、客观性B、时效性C、传递性D、共享性{第3页} 11、信息素质的内涵主要包括(ABC)。A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页} 12、以下类型的信息属于三次信息的是(BC)。A、目录B、词典C、百科全书D、科技报

告{第4页} 三、判断 13、档案文献具有原始性特点,客观真实地反映了历史。(∨){第8页} 14、年鉴和百科全书属于二次信息。(×){第4页} 15、图书一般不能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。(∨){第6页} 16、文献信息源是各种信息源中检索与利用的主体。(∨){第3页} 17、一次信息也称为第一手资料,如书目和索引。(×){第4页} 18、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。(×){第4页} 19、知识被包含于信息,是信息的组成部分。(×){第2页} 20、专利说明书属于二次信息的范畴。(×){第4页} 第二章 一、单选 21、(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。A、查全率 B、查准率 C、误检率 D、漏检率{第43页} 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D)。A、G636.33 B、G216.2 C、I247.4 D、H319{第21页} 23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据{第34-35页} 24、布尔逻辑检索中检索符号“OR”的主要作用在于(C)。A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量{第35页} 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C)。A、目录B、题录C、索引D、文摘{第30页} 26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A )A、全文检索B、文献检索C、超文本检索D、超媒体检索{第14页}

浅谈网络信息检索的现状及其发展趋势

浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1.信息检索概述 信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2.网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3.网络信息检索的现行模式 3.1 网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文

网络信息检索(新媒体)

西安欧亚学院 《网络信息检索》 课程大纲 适用专业:网络与新媒体专业 编制单位:网络与新媒体课程中心编制日期:2014年11月 文化传媒学院制 -1-

《网络信息检索》课程大纲 课程类别专业选修课课程代码1D216220 适用专业网络与新媒体学时学分32/2 编制人余君制定日期2014年11月审定组(人)审定日期 一、课程概述 1、课程描述: 《网络信息检索》是网络与新媒体专业的一门专业选修课程。当今社会,信息成为人类赖以生存和发展的重要资源,面对浩瀚且杂乱无序的信息海洋,为使我校大学生能够迅速及时地查询所需信息,确保我校各类国际引进课程的教学效果和教育教学方式方法改革的实施,增强学生的国际网络使用及信息检索能力,促进我校大学生地知识更新、终身学习和知识再创造,学校作为通识必修课程在全校新生开设本门课程,具有重要的意义。 本门课程主要针对大学生的特定需求,培养大学生了解各种信息资源的特点、掌握各种分类信息资源的检索工具、方法、途径、检索技巧等,进而掌握现代信息检索技术,使之能够熟练运用各种信息检索工具,获取所需要的信息,增强学生获取、评价和利用专业文献信息的能力,形成良好的信息素养,为促进学生开展自主、探究式学习,造就创新型人才起到重要作用。 2、设计思路 本门课程课堂教学的设计思路是准备采取讲练结合,以练习为主的教学模式,按照三个“三分之一”的比例设计课程并组织教学,三分之一的教学内容采取讲授方式组织教学,三分之一的内容以边讲边练的方式组织教学,三分之一的内容以训练方式组织教学。这种教学方式充分体现学校目前倡导的新课程改革精神,突出学生学习的主体地位,变传统的教师知识独白式地传递信息为学生自己去解析和吸收信息的教学模式。本课程 -2-

网络信息检索2013--B

中国矿业大学信电学院2013年 “院长杯”科技文化节 网络信息检索试题【B卷】 说明:1.本考试为闭卷考试,请考生遵守考试纪律,独立完成。 2.本次考试为上机考试,满分100分,考试时间为120分钟,未在22日下午4:30—6:30按要求提交试卷的考试成绩无效,请考生合理把握考试时间。在试卷得分相同时,由参赛者上传作答试题的先后顺序确定获奖的高低等次。 3.参赛者须完整、准确地填写相关信息,并按竞赛通知的要求作答、上传试题。(注:选择题、判断题的答案填在前面的表格里;填空题的答案填在空白处的横线上;简答题以及实践题答在每一道小题的后面。填写位置有误或格式错误,该题以零分计入成绩) 姓名班级学号分数 第一部分理论题(共50分) 一、单项选择题(每小题1分,共10分) (注:请在答题栏相应位置填写答案) 1、检索最新的学术动态方面的信息,最好用哪种检索工具书?( ) A、手册 B、年鉴 C、期刊 D、书目

2、FTP可以实现资源共享,它提供了一个免费的公共帐号()。 A、System B、administrator C、Anonymous D、必须事先申请 3、哪个数据库是我国第一个连续出版的大规模集成化、多功能的学术期刊全文文献检索系统?( ) A、CNKI B、维普科技期刊数据库 C、人大复印资料数据库 D、百度 4、按照使用地区来划分,标准的不包括以下哪种类型?( ) A、国际标准 B、国家标准 C、地区标准 D、行业标准 5、按照传递媒介来划分,下列哪项不属于情报的类型?() A、文字情报 B、战术情报 C、实物情报 D、声像情报 6、信息检索根据检索对象不同一般分为( )。 A、二次检索、高级检索、文献检索 B、分类检索、主题检索 C、计算机检索、手工检索 D、数据检索、事实检索、文献检索 7、我如果想查广东古代各市、县发生的大事,从2008年起查,要用哪种检索方法?( ) A、顺查法 B、倒查法 C、循环法 D、抽查法 8、关于WWW的说法,不正确的是()。 A、需要Web浏览器访问信息 B、采用HTML协议进行通信控制 C、可以访问多媒体信息 D、必须通过拨号网络连接方式访问 9、以下不属于三次文献的是( )。 A、综述 B、索引 C、手册 D、年鉴 10、题录Piterniek A B. Functions and capabilities of online searching systems: a checklist[C].Online Review,1989,13(6):466-469.是哪种信息类型的著录格式()。 A、期刊 B、图书 C、会议记录 D、学位论文 二、填空题(每小题2分,共20分)

网络信息资源检索与利用第二章.doc

网络信息资源检索与利用 授课教师:史先红 第二章网络信息资源检索概述 ?音讯、消息通讯系统传输和处理的对象客观事物存在的方式及运动状态的表征 4、与信息相关的几个概念 5、信息、知识、文献、情报的关系 图书馆资源与Internet资源的比较 按信息资源“获取的难易程度”划分 白色信息资源:公开发行、较容易获得,如正式出版的图书、期刊。 ?黑色信息资源:保密状态、极难获得,如未解密的政府文件、技术档案。 灰色信息资源:获取难度介于黑、白色之间,如会议资料、未公开的学位论文。网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。(3)按信息内容的表现形式和内容划分可分为 ?全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; ?事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; ?数值型信息:主要是指各种统计数据、实验数据; ?数据库类信息:如DIALOG,万方等,是传统数据库的网络化; ?微内容(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。 ?其它类型:投资行情和分析,图形图象,影视广告等。 (1)网站信息资源 ?中国教育部:https://www.sodocs.net/doc/4f9997451.html,/ ?新浪教育频道:https://www.sodocs.net/doc/4f9997451.html,/ ?中国中小学教育教学网:https://www.sodocs.net/doc/4f9997451.html,/ (2)电子期刊h t t p://w w w.a b b a o.c n (3)在线数据库 4)电子书 ?电子书代表人们所阅读的数字化出版物,从而区别于以纸张为载体的传统出 版物,电子书是利用计算机技术将一定的文字、图片、声音、影像等信息,通过数码方式记录在以光、电、磁为介质的设备中,借助于特定的设备来读取、复制、传输。 ?电子图书可手动触摸翻页、识别包含PDF等多种文件格式。

信息检索论文

关于网络信息的检索 摘要:在信息技术迅速发展的推动下,传统信息服务机构和网络信息服务运营商逐步走上由信息服务向知识服务的转型之路。在这种趋势下,信息检索也由过去单纯的字符匹配逐步转向面向内容、基于知识的信息检索。在这里简单探讨一下基于知识服务的信息检索效率的基本概念和评价指标,剖析语义分析程度、信息模型、检索方法和信息收录范围等主要影响因素,最后通过一个实例,对比分析说明知识服务将提高用户信息检索的效率。 关键词:信息检索,网络信息,信息,搜索引擎 引言 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 1信息检索概述 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 ①布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。 ②模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。 ③概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。 2.3 网络信息检索的特点 ①信息检索的范围不断拓宽; ②信息检索手段更加容易; ③信息检索的途径更加灵活。 2.4网络信息检索与传统信息检索的区别

网络信息检索的现状与发展

网络信息检索的现状与发展网络信息检索的现状与发展 1.基于网页的网络信息检索工具的现状和发展趋势 页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的 最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目 录两种。网页搜索引擎是通过"网络蜘蛛"等网页自动搜寻软件搜索到网页,然 后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络 可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎 完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人 员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜 索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因 此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。但 是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的 不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量 重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异 的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎 不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。 2.发展趋势 网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。主要体现在以 下几个方面:网络检索工具开发提供商之间合作越来越紧密。过去一般网络检 索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现 在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜

09网络信息检索概述

第9章网络信息检索概述 【本章要点】 ●介绍网络信息资源的概念 ●阐述网络信息资源的特点与类型 ●论述网络信息资源的分别 ●分析网络信息检索的原理及方法 ●简述网络信息检索的相关标准 ●探讨网络信息检索的发展趋势 9. 1 网络信息资源分布 9.9.1网络信息资源的特点 网络信息资源(Network Information Resource)指可在互联网上发表、查询与存取利用的信息资源总和。 1.优点:(1)数量巨大,增长迅速(2)内容丰富,形式多样(3)结构复杂,分布广泛(4)开发互动,共享性强(5)传播快速,利用方便(6)更新速度快,动态性强(7)信息使用成本低 1)数量巨大,增长迅速:重要特点为海量;信息源庞杂; 2)内容丰富,形式多样:学科、领域、语言;图文、音像、软件、DB,呈现多类型、多媒体、跨地 区、跨语种等特征; 3)结构复杂,分布广泛:无统一标准规范,分布广泛;半结构化数据日趋丰富; 4)开发互动,共享性强:共享多种资源,自由传输发布;网络环境下时空范围最大化延展;交互性 表现为主动性、参与性、交谈性、和操作性; 5)传播快速,利用方便:高速信息资源传输通道辐射全球;检索和获取的便利; 6)更新速度快,动态性强:本质是动态系统,高度动态性,时效性强,更新频率快; 7)信息使用成本低:大部分免费,收费与其他相比较低。 2.缺点 1)质量参差不齐,良莠不一:开放性,发布自由; 2)分散无序,缺乏管理:宏观无序、分散、不规范,缺乏稳定性和可靠性; 3)稳定性差,精确度低,缺乏安全保障:高度动态性,无统一经营管理机构,统一的发布 标准。

9.1.2网络信息资源资源的类型(07武大简答) 按网络信息资源的媒体形式文本信息、图片信息、音频信息、视频信息、三位虚拟影像信息 按人类信息交流的方式正式出版信息、半正式出版信息、非正式出版信息 按信息的加工程度一次网络信息资源、二次网络信息资源、三次网络信息资源按网络信息的内容和用途普通型、专门资料型、数据资料型、及时资料型 按信息的表现形式全文型、数值型、书目文献型和实时活动型 按传输协议的不同WWW信息资源、Telnet信息资源、FTP信息资源、网络论 坛、Gopher信息资源 9.1.3网络信息资源的分布 9.1.3.1网络信息资源的内容 1.政府信息 2.教育科研信息 3.网上出版物 4.网络数据库 5.电子论坛和电子会议 6.网上专利信息 9.1.3.2网络信息资源分布的特征 1.离散性: 类型庞杂;发布内容自由性、任意性大,缺乏过滤、质量控制和管理机制,不同类型信息混为一体,大量不健康信息扩散,显示了网络信息资源的分散性和无序性。 2.不均衡性: 主要表现在地区分布和语言分布等方面。信息资源分布基本反映该地区经济、文化等方面的发展水平,全球:美为首发达国家大大高于发展中国家;我国:东部地区高于西部地区。网络中文信息贫乏已成为现实问题。 请谈谈互联网对信息检索的巨大影响(07华南师范论述) 补充:网络信息检索的特点 1)检索范围大 2)传统检索方法与全新网络检索技术相结合 3)用户界面友好且检索方便 4)用户透明度高 5)信息冗余大 9. 2 网络信息检索原理与方法 9.2.1网路信息检索原理 9.2.1.1网路信息检索及其特点 1.检索对象得到了极大的丰富:图文、音像、软件、DB,呈现多类型、多媒体、跨地区、跨语种等特征 2.检索空间得到了极大的扩展:检索范围覆盖整个互联网这一全球性的网络 3.检索趋于简单方便: 1)WWW提供了超链接方式,相关性较强 2)用户检索界面、检索结果提供等方面交互性良好、信息反馈功能较好 3)自然语言广泛运用,使检索日趋简洁,检索交互性提高 不足:

信息检索工具与方法概述

张龙飞 080905238 信息检索工具与方法概述 信息社会给人们带来了浩如烟海的信息,令人们享受不尽,同时也感到无所适从。如何从泛滥的信息大潮中获有价值的东西,成了人们面临的迫切问题。因此,信息检索能力的高低,绝顶了人们发展的潜力。传统的教育模式注重书本知识的输入,不注意培养独立工作的能力和获取知识的技术和手段,结果培养出的人很难适应社会的发展。面对信息社会的挑战,现代教育应该发展人们的综合水平,提高技术手段的培养。因此,必需掌握最新的技术-----信息检索。以下是根据我个人的了解对信息检索技术进行的阐述和概括。 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。 那么,我们为什么要进行检索工作呢? 在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。在这么多的信息之中要找到不重复而又有效的信息内容就必需进行检索。 要进行信息检索首先要有检索工具。检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献。一般说来,检索工具应具备以下五个条件:①明确的收录范围;②有完整明了的文献特征标识;③每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识;④全部条目科学地、按照一定规则组织成为一个有机整体;⑤有索引部分,提供多种必要的检索途径。 目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。检索工具有不同的分类方法,按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具;按照出版形式不同可分为:期刊式检索工具,单卷式检索工具,卡片式检索工具,胶卷式检索工具;按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。总的来说,可将检索工具分为以下四种类型。 1. 目录型检索工具 目录型检索工具是记录具体出版单位、收藏单位及其他外表特征的工具。它以一个完整的出版或收藏单位为著录单元,一般著录文献的名称、著者、文献出处等。目录的种类很多,对于文献检索来说,国家书目、联合目录、馆藏目录等尤为重要。 2. 题录型检索工具 题录型检索工具是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等),无内容摘要,快速报道文献信息的一类检索工具。它与目录的主要区别是著录的对象不同。目录著录的对象是单位出版物,题录的著录对象是单篇文献。 3. 文摘型检索工具 文摘型检索工具是将大量分散的文献,选择重要的部分,以简炼的形式做成

网络信息检索技术

网络信息实用检索技术作业2 中文数据库检索实践 一.列出10种中文数据库名称,并简要注明其资源特点: 1.中国知网 中国知网,是国家知识基础设施(National Knowledge Infrastructure,NKI)的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。在党和国家领导以及教育部、中宣部、科技部、新闻出版总署、国家版权局、国家计委的大力支持下,在全国学术界、教育界、出版界、图书情报界等社会各界的密切配合和清华大学的直接领导下,CNKI 工程集团经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的"CNKI数字图书馆",并正式启动建设《中国知识资源总库》及CNKI 网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。 2.万方数据库 万方数据库是由万方数据公司开发的,涵盖期刊,会议纪要,论文,学术成果,学术会议论文的大型网络数据库。也是和中国知网齐名的中国专业的学术数据库。开发公司——万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。 3.中文科技期刊数据库 由专业质检人员对题录文摘数据进行质检(包括标引和录入错误),确保原始文本数据的质量。考虑到在期刊收录过程中存在缺期情况,公司定期进行刊期统计并作增补,数据完整率达到99%以上。在主题标引用词基础上,编制了同义词库、同名作者库并定期修订,有助于提高文献检全率。 4.中国医院知识仓库(China Hospital Knowledge Databases,简称CHKD)数据库介绍 中国医院知识仓库(China Hospital Knowledge Databases,简称CHKD),是在1997年创办的《中国学术期刊(光盘版)》医药卫生专辑的基础上发展而来,专门针对各级各类医疗卫生机构的信息化、知识化建设而设计的大型全文知识仓库,为CNKI工程的重要知识仓库之一。 CHKD库中不但收录医药卫生和生物科学专业知识信息,而且收录经营管理、图书情报、计算机及其应用和外文学习类等医院需要的各类知识信息。CHKD库中的所有信息,均提供一次文献(文献原文)。文献资源从1994年至今。每天进行追加更新。现在我馆使用了CHKD 期刊全文数据库、CHKD博硕士学位论文数据库和CHKD会议论文库。 5.中文社会科学引文索引 “中文社会科学引文索引”(CSSCI)由南京大学研制而成 CSSCI来源文献检索界面,是国家、教育部重点课题攻关项目。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法从全国中文人文社会科学学术性期刊中选出学术性强、编辑规范的期刊作为来源期刊。现已开发的CSSCI(1998—2006年)9年数据,来源文献近63万余篇,引文文献409余万篇。 6.中国期刊全文数据库(CJFD) 海量数据的高度整合,集题录、文摘、全文文献信息于一体,实现一站式文献信息检索

计算机信息检索

一.名词解释 1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的 需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。 2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的 指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。 3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特 征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存 贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 5.搜索引擎:搜索引擎有广义与狭义之分。广义的搜索引擎泛指网络上提供信息检索服务 的攻击或系统。狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。 6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的 资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。 7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。一般地说,一个数据库至少 包括一个顺排文档和一个倒排文档。(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。 8 .检索语言:是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言(体系分类语言、主题词语言)和非规范化语言(自然语言)两类。 9.自然语言:索引词汇直接来自系统所处理的文献或提问本身,使用前未经过优选和规范化处理的一类检索语言。 10.超文本:是一个非线性的网状结构,它以结点为单位组织信息,在结点与结点间通过链接加以连接,构成表达特定内容的信息网络。 二.简答 1.简述一下因特网信息检索的特点 (1)检索范围大 (2)检索效率高 (3)检索工具强大 (4)信息冗余 2.搜索引擎的基本工作原理 搜索引擎的基本模式是:运行特定的网络搜索程序,定期地搜索Internet的各个站点,送回收集到的文献信息(包括Web页面和新闻组文章等),并利用索引软件对这些文献进行自动标引,加入集中管理的索引数据库;同时,在Internet上设立提供检索界面的Web站点,由用户输入提问检索式,通过特定的检索软件,查找其索引数据库,给出与

相关主题