搜档网
当前位置:搜档网 › 信息分类法

信息分类法

信息分类法
信息分类法

什么是面分类法[1]

面分类法是将要分类的事物或对象的若干个属性或特征视为若干个面,每个面又可以分成彼此独立的若干类目,使用时根据需要将这些面中的类目组合在一起,形成一个复合类目。

面分类法结构[1]

面分类法的基本原则[2]

在选用面分类法时,应遵循以下几条基本原则:

(1)根据需要,选择分类对象本质的属性或特征作为分类对象的各个“面”;

(2)不同“面”的类目不应相互交叉,也不能重复出现;

(3)每个“面”有严格的固定位置;

(4)“面”的选择以及位置的确定,应根据实际需要而定。

面分类法的优缺点[2]

面分类的主要优点是分类结构上具有较大的柔性,即分类体系中任何一个”面”内类目的变动,不会影响其它”面”,而且可以对”面”进行增删。再有,”面”的分类结构可根据任意”面”的组合方式进行检索,这有利于计算机的信息处理。

面分类的主要缺点是不能充分利用编码空间。例如,在上面的服装分类中,纯毛男式连衣裙的搭配是毫无意义的,在实际编制代码体系时,到底采用哪一种分类方法,要根据课题中需要解决的问题而定。有时,还可根据事物的特征,在一个分类体系中,同时运用线分类法和面分类法。

面分类法

面分类法也称平行分类法,它是把拟分类的商品集合总体。根据其本身固有的属性或特征,分成相互之间没有隶属关系的面,每个面都包含一组类目。将某个面中的一种类目与另一个面的一种类目组合在一起,即组成一个复合类目。面分类法具有类目可以较大量地扩充、结构弹性好、不必预先确定好最后的分组、适用于计算机管理等优点,但也存在不能充分利用容量、组配结构太复杂、不便于手工处理等缺点。

面分类法则将整形码分为若干码段,一个码段定义事物的一重意义,需要定义多重意义就可以采用多个码段。这种代码的数值当然也可以在数轴上找到表达,然而,一根数轴却只能约束一重意义上父类与子类的从属关系,多重意义的约束就要用多根数轴来实现,也就是说一个码段对应一根数轴。面分类是若干个线分类的合成。

基于这一理解,线分类法应该属于1维分类法,面分类法则为2维或多维的分类法。

现实生活中,面分类法的应用可谓广泛,以大家熟悉的15位的身份证号码为例:第一段(前6位)

描述办证机关的至县一级的空间定位,采用省、市、县的行政区划代码给码;第二段(7至12位)是生辰时序的描述,以办证个人的诞辰给码;而最后3位至少有两重意义,一是同县同日出生者的办证顺序,二是性别,末位奇数为男性,偶数为女性。

采用面分类法编码,虽然增加了代码的复杂性,但却可以处理线分类法无法解决的描述对象多重意义的问题,在地理信息数据分类编码中大有可为。

目前,在实际运用中,一般把面分类法作为线分类法的补充。我国在编制《全国工农业产品(商品、物资)分类与代码》国家标准时,采用的是线分类法和面分类法相结合,以线分类法为主的综合分类法。

线分类法

什么是线分类法[1]

线分类法也称层次分类法。它将要分类的对象(被划分的事物或概念)按其所选择的若干个属性或特征,按最稳定本质属性逐次地分成相应的若干层类目,并排列成一个自‘层次的逐级展开的分类体系。[编辑]

线分类法的内容[2]

在这个分类体系中,同位类的类目之间存在并列关系,且不重复,也不交叉;下位类与上位类目之间存在着隶属关系。

所谓上位类,即在线分类体系中,一个类目相对于由它直接划分出来的下一级类目而言,称为上位类。

下位类即在线分类体系中,由上位类直接划分出来的下一级类目相对上位类而言,称为下位类。同位类,即在线分类体系中,由一个类目直接划分出来的下一级类目,彼此称为同位类。

线分类法的缺点[3]

(1)揭示主题或事物特征的能力差,往往无法满足确切分类的需要,不能充分提示目前大量存在的细小分类问题。

(2)分类表具有一定的凝固性,不便于根据需要随时改变,也不适合进行多角度的信息检索。

(3)无法根据现代科学的发展自动生成新类,难以与科学的发展保持同步。

(4)大型分类表一般类目详尽、篇幅较大,对分类表管理的要求较高。

线分类法

线分类法是我国采用的,依据《中华人民共和国国家标准(GB/T4754—94)》对我国国民经济行业进行的一种分类方法。它将社会经济活动划分为门类、大类、中类和小类四级。与此相对应,此编码主要采用层次编码法。

信息分类的基本方法有两种:线分类法与面分类法

线分类法:线分类法也陈称等级分类法。线分类法按选定的若干属性(或特征)将分类对象逐次地分为若干层级,每个层级又分为若干类目。统一分支的同层计类目之间构成并列关系,不同层级类目之间构成隶属关系。同层级类目互不重复,互不交叉。

例如,我国行政区划编码,是采用线分类法,6位数字码。第1、2位表示省(自治区、直辖市),第3、4位表示地区(市、州、盟),第5、6位表示

县(市、旗、镇、区)的名称。

中国图书分类法简表第五版

中国图书分类法简表(第五版) A 马克思主义、列宁主义、毛泽东思想、邓小平理论 A1 马克思、恩格斯著作 A2 列宁著作 A3 斯大林著作 A4 毛泽东著作 A49 邓小平著作 A5 马克思、恩格斯、列宁、斯大林、毛泽东、邓小平著作汇编 A7 马克思、恩格斯、列宁、斯大林、毛泽东、邓小平生平和传记 A8 马克思主义、列宁主义、毛泽东思想、邓小平理论的学习和研究 B 哲学、宗教 B0 哲学理论 B1 世界哲学 B2 中国哲学 B3 亚洲哲学 B4 非洲哲学 B5 欧洲哲学 B6 大洋州哲学 B7 美洲哲学 B80 思维科学 B81 逻辑学(论理学) B82 伦理学(道德学) B83 美学 B84 心理学 B9 宗教 C 社会科学总论 C0 社会科学理论与方法论 C1 社会科学概况、现状、进展 C2 社会科学机构、团体、会议 C3 社会科学研究方法 C4 社会科学教育与普及 C5 社会科学丛书、文集、连续性出版物 C6 社会科学参考工具书 [C7]社会科学文献检索工具书 C79 非书资料、视听资料 C8 统计学 C91 社会学 C92 人口学 C93 管理学 [C94] 系统科学 C95 民族学、文化人类学 C96 人才学 C97 劳动科学 D 政治、法律 D0 政治学、政治理论 D1 国际共产主义运动 D2 中国共产党 D33/37 各国共产党 D4 工人、农民、青年、妇女运动与组织 D5 世界政治 D6 中国政治 D73/77 各国政治 D8 外交、国际关系 D9 法律 DF 法律 E 军事 E0 军事理论 E1 世界军事 E2 中国军事 E3/7 各国军事 E8 战略学、战役学、战术学 E9 军事技术 E99 军事地形学、军事地理学 F 经济 F0 经济学 F1 世界各国经济概况、经济史、 经济地理 F2 经济管理 F3 农业经济 F4 工业经济 F49 信息产业经济 F5 交通运输经济 F59 旅游经济 F6 邮电通信经济 F7 贸易经济 F8 财政、金融 G 文化.科学.教育.体育 G0 文化理论 G1 世界各国文化与文化事业 G2 信息与知识传播 G3 科学、科学研究 G4 教育 G8 体育 H 语言、文字 H0 语言学 H1 汉语 H2 中国少数民族语言 H3 常用外国语 H4 汉藏语系 H5 阿尔泰语系(突厥-蒙古-通I 文学 I0 文学理论 I1 世界文学 I2 中国文学 I3/7 各国文学 K 历史、地理

国民经济行业分类(GB_T4754-2011)

附件1: 国民经济行业分类 (GB/T 4754-2011) 1 范围 本标准规定了全社会经济活动的分类与代码。 本标准适用于在统计、计划、财政、税收、工商等国家宏观管理中,对经济活动的分类,并用于信息处理和信息交换。 2 术语和定义 下列术语和定义适用于本文件。 2.1 行业 industry 行业(或产业)是指从事相同性质的经济活动的所有单位的集合。 2.2 主要活动 principal activity 当一个单位对外从事两种以上的经济活动时,占其单位增加值份额最大的一种活动称为主要活动。如果无法用增加值确定单位的主要活动,可依据销售收入、营业收入或从业人员确定主要活动。 与主要活动相对应的是次要活动和辅助活动。次要活动是指一个单位对外从事的所有经济活动中,除主要活动以外的经济活动。辅助活动是指一个单位的全部活动中,不对外提供产品和劳务的活动。辅助活动是为保证本单位主要活动和次要活动正常运转而进行的一种内部活动。 2.3 单位 unit 本标准中的单位是指有效地开展各种经济活动的实体,是划分国民经济行业的载体。 2.4 产业活动单位 establishment 产业活动单位是法人单位的附属单位。产业活动单位应具备下列条件: ——在一个场所从事一种或主要从事一种经济活动; ——相对独立地组织生产、经营或业务活动; ——能够掌握收入和支出等资料。 2.5 法人单位 corporate unit 具备下列条件的单位为法人单位: ——依法成立,有自己的名称、组织机构和场所,能够独立承担民事责任; ——独立拥有和使用(或授权使用)资产,承担负债,有权与其他单位签定合同;

信息组织自考试题汇总.pdf

1.什么是信息组织 信息组织指根据使用的需要,依据主题内容或特征,将信息资源组织为有序集合的过程。 2、信息组织与信息检索的关系 信息组织与信息检索是密切联系的,一方面,信息组织是信息检索的基础和前提,只有进行信息资源处理和有序化组织,才可以利用它有效地进行检索查找;另一方面,信息检索是信息组织的出发点和归宿,是信息组织的真正原因。两者既有区别,又是相互依存,相互作用,互为因果的。 3、信息组织活动的类型 (1)信息组织的操作,指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。 (2)信息资源组织规范,是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作 的的依据。包括:信息描述规范、检索语言。 4、根据对象与特点划分的检索工具的类型 文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具包括文献收藏目录和书目。 索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等。 机读数据库:是一种依托现代计算机技术、以机读形式建立的检索系统。一数据库通常由某种同类记录按照一定的方式组织 而成。 网络搜索引擎:以网络信息资源为对象的检索系统,是上述各种系统的。 5、两种基本检索途径及其特点(按照标识特征,检索工具可分的两类) 一类以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径,常见的这类标识包括:责任者名,题名,机 构名等。可以查找一种或数种文献。 另一类则以表达信息资源主题内容的标误用为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种。使用这类途径检索,不必预先了解文献特征,可直接从主题内容入手进行查找。 6、传统检索系统中对信息资源处理的基本方式(1)对信息资源进行描述,包括:着录或编写题录。(2)对信息资源的内容进行浓缩。包括:编写内容提要或文摘。(3)提供检索点。包括:着者名,标题名称,出版机构名等。 检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。 检索语言由词汇和语法两部分组成。词汇是检索语言的主体,是各种词表,包括分类表或标题表、叙词表等;语法,则是 分类标引和主题标引的规则系统,它们规定词汇集的使用方法。 1、信息资源分类的含义、特征、作用 信息资源分类含义:根据信息资源的内容属性和其他特征,将各种类型的信息资源分门别类地,系统地组织和揭示的方法。 信息资源分类特征: 是按照内容特征的相互关系加以组织的。 从一定的角度出发组织和揭示信息资源的。 以一定标记符号作为排序工具。 通过类目索引提供从字顺角度查找类目的途径。 分类法的作用: 进行资源组织。文献分类排架 建立分类检索工具。即将分类法用于信息资源的揭示 分类统计。是有效进行资源管理和利用的基本手段 兼容工具。 2、信息资源分类法及其类型 信息资源分类法——指根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具。 分类法类型:根据涉及学科领域:综合性分类法、专业分类法.根据适用的文献类型:图书分类法,文献分类法、期刊分类 法、标准文献分类法、专利分类法、网络资源分类法等.根据信息资源规模:大型分类法、中小型分类法等.根据类表的媒体形式:印刷型分类法、机读分类法.按照分类法编制方式:等级列举式,分面组配式、列举—组配式分类法 3、等级列举式、分面组配式分类法及其特点 等级列举式分类法,亦称列举式分类法、枚举式分类法,是一种将所有的类目组织成一个等级系统,并且采用尽量列 举的方式编制的分类法。 其特点:类目体系直观,易于把握,便于使用;类目展开比较系统;标记简明,适合分类排架和组织分类目录。 分面组配式分类法:一种按照分析—综合原则编制的分类表。 只在类表中按照范畴列出各种基本概念,并分别配予相应号码,使用时,先分析文献主题,根据主题分析的结果,通 过相应概念的组配表达文献主题,以各个概念标识的组合,表示该主题在分类体系中的次序,这种分类法称为分面组配式 分类法。 其特点:可通过概念组配,对复合主题进行专指标引; 标记具有较强的表达性,便于调整组配次序,进行多无检索; 可通过组配表达新出现的复杂主题,与科学的发展保持同步; 类表的篇幅较小,便于控制、管理、增补、修订等。 4、分类法的结构组成 分类法组成:类目体系,标记符号,说明与注释,类目索引四个方面 类目体系(表)的组成部分: 主表:基本部类、基本大类、简表、详表

信息组织试题及参考答案

信息组织试题库一、名词解释 1.情报检索语言 2.信息揭示 3.仿分 4.倒排文档 5.八分法 6.信息描述 7.层累制 8.分类 9.UDC 10. 信息组织 11. 信息标引 12. XML 13. 关键词法 14. 词族索引 15. 等级体系分类法 16. 语法信息组织法 17. 模糊检索 18. 多元搜索引擎 19. EI Village 20. 超媒体存取 21. 虚拟图书馆 22. 文献分类 23.MARC 24. SGML 25. 文献标引 26. 主题词法 27. ISBDs 28. 顺排文档 29. 引证关系组织法 30. 双位制(百分法) 31. 信息存储 32. 双关索引 33. 范畴索引 34. 组配分类法 35. 语义信息组织法 36. 书次号 37. 文献检索 38. 超文本存取技术 39. 信息检索工具 40. 文献序号索引 41. 引文索引

42. 题内关键词索引 43. DIALOG 44. 基本索引字段 45. KWOC Index 46.PB报告 47.分析标引 48.类 49.概念组配 50.主题词款目 51.部分标引 52.词族 53.族首词 54.超级组配 55.款目主题词 56.词间相容关系 57.基本部类 58.类系 59.标识 60.专类附表 61.情报检索 62.二次文献 63.报导性文摘 64.图书分类 65.题录 66.PRECIS 67.多向成族 68.主题法 69.标引 70.类名 71.类目 72.类目表 73.类列 74.基本大类 75.基本序列 76.简表 77.详表 78.复分表 79.通用附表 80.上位类下位类 81.同位类 82.交替类目 83.参见类目 84.标记制度 85.单纯号码

中图图书馆分类法简表(第五版)

中图法简表(第五版) 基本部类基本大类简表(二级类) 马克思主义、列宁主义、毛泽东思想A马克思 主义、列 宁主义、 毛泽东 思想、邓 小平理 论 A1 马克思、恩格斯著作 A2 列宁著作 A3 斯大林著作 A4 毛泽东著作 A49 邓小平著作 A5 马克思、恩格斯、列宁、斯大林、 毛泽东、邓小平著作汇编 A6 马克思、恩格斯、列宁、斯大 林、毛泽东、邓小平生平和传记 A7 马克思主义、列宁主义、毛泽 东思想、邓小平理论的学习和研究 哲学B哲学、 宗教 B0 哲学理论 B1 世界哲学 B2 中国哲学 B3 亚洲哲学 B4 非洲哲学 B5 欧洲哲学 B6 大洋州哲学 B7 美洲哲学 B80 思维科学 B81 逻辑学(论理学) B82 伦理学(道德学) B83 美学 B84 心理学 B9 宗教 社会科学C 社会科 学总论 C0 社会科学理论与方法论 C1 社会科学概况、现状、进展 C2 社会科学机构、团体、会议 C3 社会科学研究方法 C4 社会科学教育与普及 C5 社会科学丛书、文集、连续性出版物 C6 社会科学参考工具书 [C7] 社会科学文献检索工具书 C79 非书资料、视听资料 C8 统计学 C91 社会学 C92 人口学 C93 管理学 [C94] 系统科学 C95 民族学、文化人类学 C96 人才学 C97 劳动科学 D 政治 法律 D0 政治学、政治理论 D1 国际共产主义运动 D2中国共产党 D33/37 各国共产党 D4 工人、农民、青年、妇女运动与组织 D5 世界政治 D6 中国政治 D73/77 各国政治 D8 外交、国际关系 D9 法律 DF 法律 E 军事 E0 军事理论 E1 世界军事 E2 中国军事 E3/7 各国军事 E8 战略学、战役学、战术学 E9 军事技术 E99 军事地形学、军事地理学

证监会行业分类方法

证监会行业分类: 大类:A 农、林、牧、渔业 B 采掘业 C 制造业 D 电力、煤气及水的生产和供应业 E 建筑业 F 交通运输、仓储业 J 房地产业 H 批发和零售贸易 I 金融、保险业 G 信息技术业 K 社会服务业 L 传播与文化产业 M 综合类 A 农、林、牧、渔业 A01 农业 A0101 种植业 A0199 其他农业 A03 林业 A05 畜牧业 A0501 牲畜饲养放牧业 A0505 家禽饲养业 A0599 其他畜牧业 A07 渔业 A0701 海洋渔业 A0705 淡水渔业 A09 农、林、牧、渔服务业 A0901 农业服务业 A0905 林业服务业 A0915 畜牧兽医服务业 A0920 渔业服务业 A0999 其他农、林、牧、渔服务业 B 采掘业 B01 煤炭采选业 B0101 煤炭开采业 B0105 煤炭洗选业 B03 石油和天然气开采业 B0301 天然原油开采业 B0305 天然气开采业 B0310 油页岩洗选业 B05 黑色金属矿采选业

B0501 铁矿采选业 B0599 其他黑色金属矿采选业 B07 有色金属矿采选业 B0701 重有色金属矿采选业 B0715 轻有色金属矿采选业 B0730 贵金属矿采选业 B0740 稀有稀土金属矿采选业 B09 非金属矿采选业 B0901 土砂石开采业 B0911 化学矿开采业 B0921 采盐业 B0999 其他非金属矿开采业 B49 其他矿采选业 B50 采掘服务业 B5001 煤炭采选服务业 B5003 石油和天然气开采服务业 B5005 黑色金属矿采选服务业 B5007 有色金属矿采选服务业 B5009 非金属矿采选服务业 B5099 其他矿采选服务业 C 制造业 C0 食品、饮料 C01 食品加工业 C0101 粮食及饲料加工业 C0111 植物油加工业 C0115 制糖业 C0120 屠宰及肉类蛋类加工业 C0125 水产品加工业 C0130 盐加工业 C0199 其他加工业 C03 食品制造业 C0301 糕点、糖果制造业 C0310 乳制品制造业 C0320 罐头食品制造业 C0330 发酵制造业 C0340 调味品制造业 C0399 其他食品制造业 C05 饮料制造业 C0501 酒精及饮料酒制造业 C0510 软饮料制造业 C0520 制茶业 C0599 其他饮料制造业 C1 纺织、服装、皮毛

证监会行业分类

上市公司行业分类指引 (2012年修订) 为规范上市公司行业分类工作,根据《中华人民共和国统计法》、《证券期货市场统计管理办法》、《国民经济行业分类》等法律法规和相关规定,制定《上市公司行业分类指引》(以下简称《指引》)。 本《指引》自公布之日起施行。2001年中国证监会公布的《上市公司行业分类指引》同时废止。 1.分类对象与适用范围 《指引》以在中国境内证券交易所挂牌交易的上市公司为基本分类对象。 《指引》适用于证券期货监管系统对上市公司行业分类信息进行统计、评价、分析及其他相关工作。中国证监会另有规定的,适用其规定。 各证券期货交易所、中国证券登记结算公司、中国证监会派出机构以及其他相关机构,向中国证监会报送统计数据所涉及的上市公司行业分类应符合《指引》的规定。 市场机构基于投资分析目的所使用的上市公司行业分类可参照《指引》规定的行业类别,但非强制适用。 2.分类原则与方法 以上市公司营业收入等财务数据为主要分类标准和依据,所采用财务数据为经过会计师事务所审计并已公开披露的合并报表数据。 当上市公司某类业务的营业收入比重大于或等于50%,则将其划入该业务相对应的行业。 当上市公司没有一类业务的营业收入比重大于或等于50%,但某类业务的收入和利润均在所有业务中最高,而且均占到公司总收入和总利润的30%以上(包含本数),则该公司归属该业务对应的行业

类别。 不能按照上述分类方法确定行业归属的,由上市公司行业分类专家委员会根据公司实际经营状况判断公司行业归属;归属不明确的,划为综合类。 3. 编码方法 本《指引》参照《国民经济行业分类》(GB T4754-2011),将上市公司的经济活动分为门类、大类两级。与此对应,门类代码用一位拉丁字母表示,即用字母A、B、C……依次代表不同门类;大类代码用两位阿拉伯数字表示,从01开始按顺序依次编码。 4. 管理机构及其职责 中国证监会统筹指导上市公司行业分类工作,负责制定、修改和完善《指引》,对《指引》及相关制度进行解释,对外发布上市公司行业分类结果。 中国上市公司协会负责按照《指引》组织对上市公司进行行业分类,向中国证监会报送上市公司行业分类结果,并向证券交易所、中证指数公司等相关机构通报上市公司行业分类结果。 中国上市公司协会建立上市公司行业分类专家委员会(以下简称专家委员会),由有关部委、证券期货监管系统和证券经营机构的专家组成。专家委员会负责就上市公司行业分类制度的修订提出意见和建议;依据专业判断,确定上市公司行业分类结果。 5. 沟通反馈机制 中国上市公司协会应当建立与上市公司的日常沟通机制,就行业类别划分及变更情况征求上市公司意见;上市公司提出不同意见的,应提请专家委员会讨论作出最终判断。 6. 行业分类流程 上市公司行业分类按季度进行。每年3月20日、6月10日、9月20日和12月20日为当季行业分类工作起始日;原则上应于季度末完成当季上市公司行业分类工作。 行业分类包括初次分类和定期调整。 初次分类是对新上市公司的行业分类,依据公司《招股说明书》进行。公司上市首日在每季度行业分类工作起始日(不含当日)之前

信息组织期末考试

一、名词解释(每题4分,共5题) 1、信息组织:根据信息检索的需要,利用一定的工具和技术将庞杂无序的信息系统化,有序化的过程。 2、信息检索:根据检索需要,利用一定的技术和手段并从检索系统中获取相应信息资源的过程。 3、信息揭示:也称信息标引,是对信息的主题内容,形式特征等的选择,概括和提炼描述的过程。 4、专指度:是指其语义的内涵与外延与信息主题的内容的切合程度 5、标引:是指对信息内容的描述。索引:是指为了方便查询信息而建立的一系列有效的规则。 6、集成法:信息组织的集成法是指在检索系统中采用具有多维信息组织的检索语言,或在同一情报检索系统中同时采用多种实现了兼容互换的检索语言。 7、分类标引:依据一定的分类语言,对信息资源的内容特征进行分析、判断、选择并赋予分类标识的过程。 8、谱系分类:是将检索语言按语系、语族、语支和语种体系划分的一种方法。 9、轮排转换:是将检索语句中的每个有意义的词依次排在检索入口,其他词保持相对位置的情况下的移动的一种形式转换。 10、分类主题一体化:是指在一个检索语言系统中,对他们的分类部分的术语,参照标识及索引实施统一的控制,使两者有机的融为一体,从而能够同时满足分类标引和主题标引的需要,发挥其最佳的整体效应。 二、填空题(每题2分,共10题) 1、常用的信息组织的方法有:分类组织法、主题组织法、集成组织法 2、《中图法》的复分表包括(通用复分表)和(专类复分表)两种。 3、信息组织常用的基本原理包括:语言学原理、系统论原理、知识组织原理、概念逻辑原理 4、对信息检索系统评价的两个重要指标是查全率和查准率 5、从文献标引所用标识是否规范区分,可将文献标引划分为受控标引、自由标引和混合标引三种形式。 6、主题词的概念等级关系主要指词与词之间的属种关系、整体与部分关系、包

网络信息组织中的分类法与主题法

【标题】网络信息组织中的分类法与主题法 【内容提要】分类法与主题法是网络信息组织的两种主要方法。文章综述了分类法与主题法在网络信息组织中的应用现状、存在问题及进一步完善的办法,并指出分类主题一体化是网络信息组织的发展趋势。 【摘要题】信息化与网络化建设 【关键词】网络信息组织/ 分类法/ 主题法/ 分类主题一体化/ 关键词/ 搜索引擎 【正文】 网络信息组织就是采用一定的方式,将Internet 中某一方面大量的、分散的、杂乱的信息(网站或网页中可索引的公共信息,不包括各种专门数据库的信息)经过整序、优化,形成一个便于有效利用的系统过程。分类法与主题法是网络信息组织的两种最主要的方法。本文拟分析分类法与主题法在网络信息组织中的应 用情况,并探讨应用中存在的问题及解决的办法。 1 分类法在网络信息组织中的运用 1.1 分类法在网络信息组织中的应用现状 目前,分类法在网络信息组织中的应用主要有两种方式:一是采用传统的分类法,主要用于学术性信息资源的组织与查询。如利用杜威十进制法(DDC) ,比较成功的综合性网络目录有加拿大国家图书馆的“ CanadianInformationbySubject ”。较好的专题性网络目录有加拿大多伦多参考图书馆的“ ExpandingUniverse ”,主要面向天文学资源。另有一些特色站点是“ GNOSIS ”、“ CyberDewey ”、“ Sized ”、“ WWLIB ”等;使用国际十进制分类法(UDC) 的网络目录有“ BUBLESubjectTree ”,它覆盖了英国国内综合性网上资源。“ NISS ”,综合性网络目录,类目前标有UDC 分类号。“ SOSIG ”,它选用了UDC 的社会科学部分的分类号,共有26 个类号;使用美国国会图书馆分类法(LLC) 的网络目录如“ CYBERSTACKS ”,由美国依阿华大学开发,主要提供6 大部类的资源。国内分类法在网络信息组织中的应用较少,《中图法》作为容量最大,使用面最广的中文图书分类法,只有在中文搜索引擎“网络指南针”中得到了应用,目前只有两级类目框架。应该说真正意义上的《中图法》的网络版还没有出现。二是采用自编的分类体系,其设计从普通用户出发,主要用于通用性网络信息资源的组织与查询。网络信息组织的自编分类体系大都是主题分类法,主题分类法基本上采用等级结构,以主题为中心,按事物而不是按学科划分类目。大多数中文搜索引擎就是采用这种分类体系来组织信息,如著名的中文搜索引擎雅虎中国 (Yahoo!) 。 1.2 利用分类法组织网络信息的优势 (1) 分类法具有较强的系统性。分类法采用划分范畴的树状结构按事物或学科分类组织网上信息资源,具 有层次清晰、体系稳定等优点。 (2) 分类法便于浏览检索。分类法的等级结构便于用户在查找时进行浏览。当用户的检索目的不明确或检 索词不确定时,分类浏览方式更有效率,它引导着用户按照初始的目标一步一步接近需求的信息。 (3) 分类法提供对非文本信息的组织。当前,网络信息资源中非文本信息占的比重越来越大,如:图形、图像、声音、动画等,分类法独有的聚类功能和代码标识在组织和揭示多媒体信息中占有极大的优势。 (4) 检索语言的通用性。分类法以知识分类为基础,以符号为标识,具备成为不同语言转换中介的条件。 1.3 分类法在网络信息组织中存在的问题 大多数中文搜索引擎都采用自编的分类体系组织网络信息,这种自编的分类体系主要存在以下问题: (1) 分类体系不严密。一些搜索引擎在划分类目时,并未真正从知识领域、知识体系的角度来分类,而仅仅从商业角度考虑,因而使得分类体系漏掉了许多重要的知识领域,体系的系统性和完整性受到很大的影

中图法分类号与中图分类法查询(全部简表)

生物科学属于Q类,医学类属于R类,可以直接转至Q或R类查询 A马克思主义、列宁主义、毛泽东思想 A1马克思、恩格斯著作 A2列宁著作 A3斯大林著作 A4毛泽东著作 A49 邓小平著作 A5马克思、恩格斯、列宁、斯大林、毛泽东、邓小平著作汇编 A7马克思、恩格斯、列宁、斯大林、毛泽东、邓小平生平和传记 A8马克思主义、列宁主义、毛泽东思想邓小平理论的学习和研究 -------------------------------------------------------------------------------- B哲学 B0哲学理论 B1世界哲学 B2中国哲学 B3亚洲哲学 B4非洲哲学 B5欧洲哲学 B6大洋洲哲学 B7美洲哲学 B80逻辑科学(总论) B81逻辑学 B82伦理学 B83美学 B84心理学 B9无神论、宗教 -------------------------------------------------------------------------------- C社会科学总论 C0社会科学理论与方法论 C1社会科学现状及发展 C2社会科学机构、团体、会议 C3社会科学研究方法 C4社会科学教育与普及 C5社会科学丛书、文集、连续性出版物 C6社会科学参考工具书 C[7] 社会科学文献检索工具书 C8统计学 C91社会学

C92人口学 C93管理学 C[94] 系统科学 C95 民族学 C96人才学 C97 劳动科学 -------------------------------------------------------------------------------- D政治、法律 D0 政治理论 D1 共产主义运动 D2 中国共产党 D3 各国共产党 D4工人、农民、青年、妇女运动与组织 D5 世界政治 D6 中国政治 D73/77 各国政治 D8外交、国际关系 D9法律 -------------------------------------------------------------------------------- E军事 E0军事理论 E1世界军事 E2中国军事 E3/7各国军事 E8战略学、战役学、战术学 E9军事技术 E99军事地形学、军事地理学 -------------------------------------------------------------------------------- F经济 F0政治经济学 F0-0马克思主义政治经济学(总论) F01经济学基本问题 F02前资本主义社会生产方式 F03资本主义社会生产方式 F04社会主义社会生产方式 F05共产主义社会生产方式 F06经济学分支学科 F08各科经济学

2.行业分类标准

行业分类标准 一.行业分类的主要依据 (一)以管理为目的的行业分类 为了对产业活动进行有效管理,人们从不同的角度对产业进行了不同的分类,如三次产业分类法、联合国标准产业分类法、我国的国民经济产业分类法等。这些分类方法一般是适应宏观经济管理的需要,分类对象是国民经济活动总体,分类体系中包括一些非经营性行业,分类原则是按照产品的统一性,根据产业的技术特点来进行分类的。 (二)以投资为目的的行业分类 自从股票市场诞生并获得迅速发展以后,股票投资便成为一种越来越重要的社会需求,编制股价指数和进行行业分类就成为了必然的需要。从证券投资的角度来说,一般的投资者只关心他们定的证券投资能否保值增值,因此证券市场的产业分类要重点反应产业的盈利前景,分类后各行业收益差别显著,对投资者进行投资活动具有意义。 二.国内外主要行业分类标准 (一)国外主要行业分类标准 1. MSCI和S&P的全球行业分类标准(Global Industry Classification Standard,GICS) 1999年8月2日,MSCI和标准普尔联合发布了新的全球行业分类标准GICS,该标准10个经济部门(Economic Sector),23个行业(Industry Group),59个行业(Industry),122个子行业(Sub-Industry)构成,共分为4个级别。对于每一个具体的公司,根据GICS和公司的主要商业活动,都可以把它归于一个确定的子行业,以及相应的经济部门、行业组和行业,在每一个级别上,一个公司只能属于一个类别。 MSCI和标准普尔指出,GICS对公司进行分类的依据主要是销售收入,其次为利润和市场。其目的是为了加强全球范围内金融从业者的投资研究和资产管理工作。

信息组织总结

信息组织总结 1、信息组织是为了把无序的信息整理归纳成为有序的信息资源的活动;信息的表示通常差不多上数据,然而只有通过了处理的数据才能成为信息。 2、信息组织活动实际上是对信息资源的处理,通常是以信息检索为基础的,因此建立检索的规范和操纵语言是信息组织的关键手段。从那个意义上说,信息检索是信息组织的目的和归属。 3、信息组织的形式(检索方式)有二种,其一是“固定排列法”;其二是“分类排列法”。常用的是分类法,本课要紧介绍分类法。 4、信息组织的研究有三个层面的内容:理论层面、规范层面和方法层面。理论层面研究信息组织的差不多规律,为规范层面和方法层面提供理论依据,指导信息组织的操作和实施。规范层面提供信息组织应该遵循的共同规范(描述规范和检索语言)。方法层面是实现信息组织的具体技术(操作方法、标引规则和描述规则) 5、信息组织是信息检索的基础和前提,信息检索是信息组织的目的和归宿。 第一章习题: 1、信息的定义是通过处理的、可供公享的数据;数据的定义是通过有意义的组合来反映客观事实特点的、能够识别、也能够传输进行通信的非随机符号。它们之间的联系是通过处理的数据确实是信息、无序数据不是信息。 2、信息组织的意义在于为了检索方便对信息资源进行的有序化组织的活动;信息组织的要紧工作过程是建立信息资源收藏系统和检索工具。 3、信息组织有四种分类,它们是文献名目、索引、机读数据库和网络引擎。 4、信息组织和信息检索的关系是检索是信息组织的目的和归宿、组织是检索的基础和前提。检索语言的意义是信息资源主题概念关系的词汇和规则所组成的人工语言系统。 第二章 1、为了有效的检索和利用信息组织,关于大型检索系统需要考虑“检全率”;而关于中、小型检索系统,检全率能够忽略,重点是“检准率”。检全率和检准率二者是反比例关系。 2、检索速度和系统及时性是涉及信息资源组织时刻和检索时刻的二个指标。另外、一个好的检索系统还要考虑“易用性”和“成本效益”。 3、要使信息组织符合实际使用的需要,是通过各种规范操纵的方法实现,包括:一是对信息组织对象的描述操纵;二是对检索过程中的词汇操纵和句法操纵。 4、为有效地组织信息,必须对描述记录的内容、描述方式进行必要的操纵,包括四个方面: ⑴描述项目操纵(依照资源的特点选择有价值的描述项目)⑵描述文字操纵(以便准确、统一地进行各种特点的记录)⑶描述级别操纵(依照系统的特点和需要,制定描述项目的详略程度)⑷描述格式的操纵(项目的次序、标识、表达形式的规范)。 5、具体的操纵规范有“词汇操纵”和“句法操纵”;“词汇操纵”是对自然语言中的词汇进行选择、规范并揭示其相关性,有“同义操纵”和“词义操纵”。“句法操纵”是依照资源标引和检索的需要,通过组词造句的规则对检索系统的语词组合方式作出规定。常用的方法有:引用次序(复合主题标引和检索时,各个主题因素的组合次序)、使用辅助符合(是进行句法操纵的重要手段,包括关系符号、逻辑组配符号、联系符号和职能符号) 6、规范操纵的依据是“以概念逻辑为工具,以知识分类为基础,依照信息资源特点和设备条件状况进行的。

行业划分及分析方法

行业划分与行业分析方法 1.行业分析意义 经济分析主要分析了社会经济的总体状况,但没有对社会经济的各组成部分进行具体分析。社会经济的发展水平和增长速度反映了各组成部分的平均水平和速度,但各部门的发展并非都和总体水平保持一致。在宏观经济运行态势良好、速度增长、效益提高的情况下,有些部门的增长与国民生产总值、国内生产总值增长同步,有些部门高于或是低于国民生产总值、国内生产总值的增长。因此,经济分析为证券投资提供了背景条件,但没有为投资者解决如何投资的问题,要对具体投资对象加以选择,还需要进行行业分析和公司分析。 2.我国证券市场的行业划分 上证指数分类法。上海证券市场为编制新的沪市成分指数,将全部上市公司分为五类,即工业、商业、地产业、公用事业和综合类,并分别计算和公布各分类股价指数。 深证指数分类法。深圳证券市场也将在深市上市的全部公司分成六类,即工业、商业、金融业、地产业、公用事业和综合类,同时计算和公布各分类股价指数。 需要注意的是,我国的两个证券交易所为编制股价指数而对产业进行的分类显然是不完全的,这与我国证券市场发展状况有关。我国上市公司数量少,不能涵盖所有行业,例如,农业方面的上市公司就较为少见。但为了编制股价指数,从目前的情况来看,这些分类是适当的。 需要注意的是,我国的两个证券交易所为编制股价指数而对产业进行的分类显然是不完全的,这与我国证券市场发展状况有关。我国上市公司数量少,不能涵盖所有行业,例如,农业方面的上市公司就较为少见。但为了编制股价指数,从目前的情况来看,这些分类是适当的。 行业划分的方法多样。除上述的划分方法外,还有其他划分方法。例如,按资源集约度来划分,可把行业分成资本集约型行业、劳动集约型行业和技术集约型行业等。 3.行业的经济结构分析 行业的经济结构随该行业中企业的数量、产品的性质、价格的制定和其他一些因素的变化而变化。由于经济结构的不同,行业基本上可分为四种市场类型:完全竞争、不完全竞争和垄断竞争、寡头垄断、完全垄断。 4.经济周期与行业分析 增长型行业

中图分类法

中图分类法 《中图分类法》是《中国图书馆图书分类法》的简称,是我国目前通用的类分图书的工具。根据图书资料的特点,按照从总到分,从一般到具体的编制原则,确定分类体系,在五个基本部类的基础上,组成二十二个大类。 目录 基本结构 (1)基本部类:如中图法分五大类部:马列毛邓;哲学;社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22个基本大类。 (3)简表:由基本大类与由其直接展开的一、二类目所形成的类目表。如: (4)详表:由简表展开的各种不同登记的类目所组成的类目表,是文献分类的真正依据。 具体分类 《中图法》的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。字母后用数字表示大类以下类目的划分。数字的编号使用小数制。现将五个基本部类及下设的二十二个大类列表如下: A马克思主义、列宁主义、毛泽东思想、邓小平理论 A1马克思、恩格斯著作 A2列宁著作 A3斯大林著作 A4毛泽东著作 A49邓小平著作 A5马克思、恩格斯、列宁、斯大林、毛泽东、邓小平著作汇编 A7马克思、恩格斯、列宁、斯大林、毛泽东、邓小平生平和传记 A8马克思主义、列宁主义、毛泽东思想、邓小平理论的学习和研究 B哲学、宗教 B0哲学理论 B1世界哲学 B2中国哲学 B3亚洲哲学 B4非洲哲学 B5欧洲哲学 B6大洋洲哲学 B7美洲哲学 B80思维哲学 B81逻辑学(论理学) B82伦理学(道德哲学) B83美学 B84心理学 B9宗教 C社会科学总论

C0社会科学理论与方法论 C1社会科学现状与发展 C2社会科学机构、团体、会议 C3社会科学研究方法 C4社会科学教育与普及 C5社会科学丛书、文集、连续性出版物 C6社会科学参考工具书 [C7]社会科学文献检索工具书 C8统计学 C91社会学 C92人口学 C93管理学 [C94]系统科学 C95民族学 C96人才学 C97劳动科学 D政治、法律 D0政治理论 D1国际共产主义运动 D2中国共产党 D33/37各国共产党 D4工人、农民、青年、妇女运动与组织 D5世界政治 D6中国政治 D73/77各国政治 D8外交、国际关系 D9法律 E军事 E0军事理论 E1世界军事 E2中国军事 E3/7各国军事 E8战略学、战役学、战术学 E9军事技术 E99军事地形学、军事地理学 F经济 F0经济学 F1世界各国经济概况、经济史、经济地理F2经济计划与管理 F3农业经济 F4工业经济 F49信息产业经济(总论) F5交通运输经济 F59邮电经济 F7贸易经济

产业领域划分

经济研究和经济管理中,经常使用的分类方法主要有两大领域、两大部类分类法,三次产业分类法,资源密集度分类法和国际标准产业分类。 (一)两大领域、两大部类分类法。这种分类法就是按生产活动的性质及其产品属性对产业进行分类。按生产活动性质,把产业部门分为物质资料生产部门和非物质资料生产部门两大领域,前者指从事物质资料生产并创造物质产品的部门,包括农业、工业、建筑业、运输邮电业、商业等;后者指不从事物质资料生产而只提供非物质性服务的部门,包括科学、文化、教育、卫生、金融、保险、咨询等部门。 (二)三次产业分类法。这种分类法是根据社会生产活动历史发展的顺序对产业结构的划分。产品直接取自自然界的部门称为第一产业,对初级产品进行再加工的部门称为第二产业,为生产和消费提供各种服务的部门称为第三产业。这种分类方法成为世界上较为通用的产业结构分类方法。我国的三次产业划分是: 第一产业:农业(包括种植业、林业、牧业和渔业) 第二产业:工业(包括采掘业,制造业,电力、煤气、水的生产和供应业)和建筑业 第三产业:除第一、第二产业以外的其他各业。根据我国的实际情况,第三产业可分为两大部分:一是流通部门,二是服务部门。具体可分为四个层次: 第一层次:流通部门,包括交通运输、仓储及邮电通信业,批发和零售贸易、餐饮业。 第二层次:为生产和生活服务的部门,包括金融、保险业,地质勘查业、水利管理业,房地产业,社会服务业,农、林、牧、渔服务业,交通运输辅助业,综合技术服务业等。 第三层次:为提高科学文化水平和居民素质服务的部门,包括教育、文化艺术及广播电影电视业,卫生、体育和社会福利业,科学研究业等。 第四层次:为社会公共需要服务的部门,包括国家机关、政党机关和社会团体以及军队、警察等。(三)资源密集程度分类法 这种产业分类方法是按照各产业所投入的、占主要地位的资源的不同为标准来划分的。根据劳动力、资本和技术三种生产要素在各产业中的相对密集度,把产业划分为劳动密集型、资本密集型和技术密集型产业。 1、劳动密集型产业。指进行生产主要依靠大量使用劳动力,而对技术和设备的依赖程度低的产业。其衡量的标准是在生产成本中工资与设备折旧和研究开发支出相比所占比重较大。一般来说,目前劳动密集型产业主要指农业、林业及纺织、服装、玩具、皮革、家具等制造业。随着技术进步和新工艺设备的应用,发达国家劳动密集型产业的技术、资本密集度也在提高,并逐步从劳动密集型产业中分化出去。例如,食品业在发达国家就被划入资本密集型产业。 2、资本密集型产业。指在单位产品成本中,资本成本与劳动成本相比所占比重较大,每个劳动者所占用的固定资本和流动资本金额较高的产业。当前,资本密集型产业主要指钢铁业、一般电子与通信设备制造业、运输设备制造业、石油化工、重型机械工业、电力工业等。资本密集型工业主要分布在基础工业和重加工业,一般被看作是发展国民经济、实现工业化的重要基础。 3、技术密集型产业。指在生产过程中,对技术和智力要素依赖大大超过对其他生产要素依赖的产业。目前技术密集型产业包括:微电子与信息产品制造业、航空航天工业、原子能工业、现代制药工业、新材料工业等。 当前以微电子、信息产品制造业为代表的技术密集型产业正迅猛发展,成为带动发达国家经济增长的主导产业。因此可以说,技术密集型产业的发展水平将决定一个国家的竞争力和经济增长的前景。 (四)国际标准产业分类 为使不同国家的统计数据具有可比性,联合国颁布了<<全部经济活动的国际标准产业分类>>(ISIC)。现在通行的是1988年第三次修订本。这套〈国际标准产业分类〉分为A-Q共17个部

信息组织考试试题

1. 以节点为基本单位,节点之间以链路相连组织网络信息资源的方式称为_B___。 A. 主页方式 B. 超文本方式 C. 数据库方式 2. 当前对大量的结构化网络信息资源进行规范话组织与管理的有效方法是_B___。 A. 文件方式 B. 数据库方式 C. 主题树方式 3.__A___的基本大类有22个。 A. 《中图法》 B. 《科图法》 C. 《人大法》 4.将逻辑上相关的一组记录集合起来便构成了计算机存贮的__B____。 A. 字段 B. 文档 C. 载体 5.对一份信息实体进行整体标引之后,再选择其局部内容进行标引称为__C__。 A. 整体标引 B. 重点标引 C. 补充标引 6.对一份信息实体所涉及到的全部主题因素进行标引,称为___C_____。 A. 整体标引 B. 分析标引 C. 全面标引 7.用于信息分类组织的号码(分类号)标识称为___A_____。 A. 人工语言 B. 自然标识语言 8.在ISBDs模式上,充分利用计算机技术所形成的一种信息资源机器处理格式是__A___ A. MARC B. AACR2 C. ISBN 9.文献分类的主要依据是___B______。 A. 事务特征 B. 文献的本质属性 C. 文献的形式特征 10.于___C_年问世的DDC(杜威十进分类法)是现代登记分类体系分类法的先驱。 A. 1905 B. 1933 C. 1876 11.标准通用标记语言_B___是一种从结构和内容的层次来描述文献格式的计算机语言。 A. MARC B. SGML C. Metadata 12.以某类子目为细分标准进行的分类活动称为__B_______。 A. 通用复分 B. 专用复分 C. 仿照复分 13._B__的主要功能是描述internet数据内容和本质特征,存储相应的检索路径。 A. XML B. metadata C. UDC 14.用于网络信息资源组织的自编分类系统大多选用_B_____形式。

《中国图书馆图书分类法》第五版简表 Microsoft Office Word 97-2003 文档

《中国图书馆图书分类法》第五版简表,方便大家查找。 A 马克思主义、列宁主义、毛泽东思想、邓小平理论 A1 马克思、恩格斯著作 A2 列宁著作 A3 斯大林著作 A4 毛泽东著作 A49 邓小平著作 A5 马克思、恩格斯、列宁、斯大林、毛泽东、邓小平著作汇编 A7 马克思、恩格斯、列宁、斯大林、毛泽东、邓小平生平和传记 A8 马克思主义、列宁主义、毛泽东思想、邓小平理论的学习和研究 B 哲学、宗教 B0 哲学理论 B1 世界哲学 B2 中国哲学 B3 亚洲哲学 B4 非洲哲学 B5 欧洲哲学 B6 大洋州哲学 B7 美洲哲学 B80 思维科学 B81 逻辑学(论理学) B82 伦理学(道德学) B83 美学 B84 心理学 B9 宗教 C 社会科学总论 C0 社会科学理论与方法论 C1 社会科学概况、现状、进展 C2 社会科学机构、团体、会议 C3 社会科学研究方法 C4 社会科学教育与普及 C5 社会科学丛书、文集、连续性出版物 C6 社会科学参考工具书 [C7]社会科学文献检索工具书 C79 非书资料、视听资料 C8 统计学 C91 社会学 C92 人口学 C93 管理学 [C94] 系统科学 C95 民族学、文化人类学 C96 人才学 C97 劳动科学 D 政治、法律 D0 政治学、政治理论 D1 中国共产党 D33/37 各国共产党 D4 工人、农民、青年、妇女运动与组织 D5 世界政治 D6 中国政治 D73/77 各国政治 D8 外交、国际关系 D9 法律 E 军事 E0 军事理论 E1 世界军事 E2 中国军事 E3/7 各国军事 E8 战略学、战役学、战术学 E9 军事技术 E99 军事地形学、军事地理学 F 经济 F0 经济学 F1 世界各国经济概况、经济史、 经济地理 F2 经济管理 F3 农业经济 F4 工业经济 F49 信息产业经济 F5 交通运输经济 F59 旅游经济 F6 邮电通信经济 F7 贸易经济 F8 财政、金融 G 文化.科学.教育.体育 G0 文化理论 G1 世界各国文化与文化事业 G2 信息与知识传播 G3 科学、科学研究 G4 教育 G8 体育 H 语言、文字 H0 语言学 H1 汉语 H2 中国少数民族语言 H3 常用外国语 H4 汉藏语系 H5 阿尔泰语系(突厥-蒙古-通古斯语系) I 文学 I0 文学理论 I1 世界文学 I2 中国文学 I3/7 各国文学 K 历史、地理

相关主题